任务与数据集
自动生成C#和SQL代码的文档描述,数据集整理自StackOverflow上的提问。
子任务
根据代码生成摘要,或根据问题检索代码。
网络架构
一个LSTM处理已生成的文本token,一个在整个代码token序列上做attention的单元,两者的输出求和,送入$\tanh$激活;得到ngram语言模型,预测下一个词语。
结果
量化评测
文本生成评测用到了BLEU等自动方法,以及人工评分,检索用到了MRR,结果都比以前的工作要好。
直观效果
该模型知道代码在操作TreeView,但没有捕捉到“add”这个动作。
对这段SQL代码的理解,模型是完全正确的。