您当前的位置: > 详细浏览

面向跨语言文本分类与标签推荐的带标签双语主题模型的研究

请选择邀稿期刊:
摘要: 针对日渐丰富的跨语言的文字信息资源与新闻报道及科技文献中的多标签数据,为了挖掘跨语言间的相关性及数据属性间的关联性,提出了带标签双语主题模型,应用于跨语言文本分类与标签的推荐。首先,假设科技文献中的关键词与摘要部分有着内容上的相关性,对关键词进行提取,并进行标签化,进而把标签对应于主题模型中的主题,实例化“潜在”的主题;其次,利用带标签双语主题模型对摘要部分进行了训练迭代;最后,对新加入的文档进行跨语言文本分类及标签的推荐。实验结果表明,跨语言文本分类任务中Micro-F1达到94.81%,推荐的标签也较好地体现出语义上的相关性。

版本历史

[V1] 2018-06-19 17:07:44 ChinaXiv:201806.00109V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1512
  •  下载量874
评论
分享