一起养成写作习惯！这是我参与「掘金日新计划 · 4 月更文挑战」的第15天，点击查看活动详情。

论文

标题：Representing Schema Structure with Graph Neural Networks for Text-to-SQL Parsing
会议：ACL 2019
链接：arxiv.org/abs/1905.06…

导语

由于之前的Text-to-SQL数据集多是在同一个schema上进行训练测试（如ATIS数据集），亦或者数据库的schema结构简单（如WikiSQL数据集为单表结构），因而，过去绝大多数模型忽略了对schema结构的建模。本篇博客将介绍一种利用GNN对schema结构进行建模的早期论文。

简介

Spider数据集有着复杂的schema结构。如图1所示，在不同的数据库schema条件下，相似的问题会得到形式完全不同的SQL语句。

之前的数据集如ATIS和WikiSQL要么不涉及跨领域数据，要么只有单表数据，造成人们很长时间以来忽略了对数据库schema结构的建模。本文提出了一种利用图神经网络GNN对数据库schema结构进行建模的方法。通过利⽤GNN中对schema结构信息的编码，提升了Text-to-SQL任务在复杂schema下的表现。

方法

本文采用的还是一个Encoder-Decoder的模型，其中使用图神经网络GNN对schema的结构进行建模表示。⾸先把表通过“表名和列名”，“foreign key --> primary key”这样的链接把db schema encode成⼀个graph，把通过graph得到的schema的embedding和question⼀起放进blstm encoder⾥⾯。decode阶段，还是lstm，但是⽤了⼀个grammar-based的⽅法，利⽤graph的规则⽣成最终query。

利用GNN对schema建模

首先将schema转换为图，以下图左侧输入为例，涉及到的表有student, semester, student_semester, program这4个，我们将表名和列名各自作为图中的一个节点。

接下来进行连边，整个图中共有三类边：

表的节点与其所有的列进行连接，例如program-> program_id；
将主外键对和相应的表连接起来，以主键为起始点的边作为第二类边，如student.student_id-> student_semester.student_id;
以外键作为起始点的边作为第三类边，例如和student_semester.student_id->student.student_id.