您当前的位置:首页 > 论文浏览
您选择的条件: 乐小虬(3)

1. chinaXiv:201711.01946 [pdf]

基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究

王子璇; 乐小虬; 何远标
分类: 图书馆学、情报学 >> 情报学

【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集, 通过训练领域词向量计算句子间WMD 距离得到相应语义相似度, 优化TextRank 算法迭代过程, 利用外部特征对所得权值进行调整, 按句子权值降序选取关键主题句。【结果】以气候变化领域科技论文作为实验数据, 以人工标注的结果为基准对本文的算法和传统的TextRank 算法进行对比实验, 初步结果表明该方法的识别效果(F值)比传统TextRank 算法提升约5%。【局限】句子特征提取有待提高, 词向量训练及方法中的相关参数需要做进一步优化。【结论】基于领域词向量, 融合WMD 语义相似度的TextRank 改进算法, 能够较好地甄别科技论文小节内部中心句, 辅以外部特征的权值调整后可以较好地识别出一篇论文的核心主题句。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量958下载量865 评论 0

2. chinaXiv:201711.02025 [pdf]

DPaper: 一种面向语义出版的结构化论文写作工具设计与实现

乐小虬; 王子璇; 张晓林; 何远标; 付常雷; 许丽媛
分类: 图书馆学、情报学 >> 情报学

【目的】面向语义出版构建论文写作工具, 在论文写作阶段实现内容结构化、对象化, 使得一篇论文即是一个系统, 论文可运行、可交互、可体验。【方法】采用数字对象和数字模板技术将论文内容(元数据、章节、数据、富媒体等)分解成不同类型数字对象, 数字对象间采用模板进行组织, 通过事件触发机制实现交互, 采用HTML5 网页形式进行编辑和呈现并存储为XML 结构化文档包。【结果】DPaper 结构化论文写作工具已上线, 提供从素材收集(云笔记)、数字对象制作、自动标引参考文献、按期刊版式呈现到Word 文档格式转换等一系列功能, 论文内容实现对象化和部分语义化。【局限】与常规论文编辑器相比, 数字对象编辑器功能还不完善, 还不能创建公式、图形等对象, 排版的灵活性不足。【结论】利用DPaper 写作工具可以在写作阶段由作者构建出满足语义出版应用需求的结构化论文。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量424下载量309 评论 0

3. chinaXiv:201711.01209 [pdf]

领域内中文科技文献中新发现语言描述特征分析*

毛琛瑜; 乐小虬
分类: 图书馆学、情报学 >> 情报学

【目的】分析领域内中文科技文献新发现语言描述特征。【方法】语义标注新发现语言描述特征, 通过句式分析、频次分布统计以及共现分析探究其特征规律。【结果】总结得到领域内中文科技文献新发现语言的句型,找出新发现语言的特征搭配。【局限】结果具有领域学科局限性, 需要进一步对比研究。【结论】利用语义标注、频次统计以及共现分析可以有效地发现中文科技文献中新发现语言的描述特征。

提交时间: 2017-10-11 来自合作期刊:《数据分析与知识发现》 点击量150下载量106 评论 0

  [1 页/ 3 条记录]