分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 机器阅读理解中的答案获取是根据问题选择或者抽象释义出文章中的内容,但得到的序列容易出现表述不准确与信息冗余的问题。针对机器阅读理解任务中的答案获取提出一种序列生成模型SGN。首先,SGN在问题矩阵空间获取问题与文章的匹配表示,并参照潜在的问题信息,生成当前节点的词向量;然后,使用一个选择门结构从文章或者字典中选择当前词汇,并且自发学习和归纳OOV(out-of-vocabulary)单词,解决语义表述不准确的问题。最后,使用改进的覆盖机制,消除生成序列中的冗余问题,从而提高可读性。实验通过人工数据集SQuAD进行验证,其结果表明,在阅读理解任务上SGN生成的目标序列与基准模型Seq2Seq相比可读性更加优异,并且与原文语义更贴近。