分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-17 合作期刊: 《计算机应用研究》
摘要: 关系抽取是信息抽取中一项重要任务,在处理问答对形式的文本时,除了文本中实体间的关系抽取之外,作为连接问句和答句之间关系的提问模式同样需要抽取。通过有监督的标注算法(条件随机场)与基于模板元组自举的半监督算法的结合在抽取实体间关系时有不错的表现。但传统半监督中发现句式模板的方式难以迁移到提问模式抽取中,针对这种情况通过引入句向量计算文本相似度并选取句式模板,提出一种基于sentence2vec技术与半监督算法结合的模型。对于最终实验,采用随机抽样进行验证。实验结果表明,相较于传统的半监督算法,本文的方法得到了更高的准确率和召回率。