您当前的位置: > 详细浏览

采用连续词袋模型(CBOW)的领域术语自动抽取研究

请选择邀稿期刊:
摘要: 【目的】更准确便捷地完成术语词汇的自动抽取。【方法】利用CBOW 模型计算构成术语的各个词部件的向量空间模型。通过词向量之间的余弦相似度衡量术语词汇内部各个词部件的关联度。利用PageRank 算法计算候选词汇的领域代表性并排序, 通过阈值的设定, 抽取出更为具有领域代表性的术语词汇。【结果】在以自然语言处理领域内的论文摘要作为数据集的实验中取得较高的准确率和召回率。【局限】测试的数据训练集偏小,而数据集的训练效果直接影响实验的效果。【结论】实验结果表明利用CBOW 模型完成术语的抽取工作是一个较为合理、可行的方法。

版本历史

[V1] 2017-10-11 13:20:06 ChinaXiv:201711.01252V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量2700
  •  下载量1810
评论
分享