您当前的位置:首页 > 论文浏览
您选择的条件: 刘建华(9)

1. chinaXiv:201711.01976 [pdf]

植物物种多样性语义知识抽取研究

刘建华; 王颖; 张智雄; 李传席
分类: 图书馆学、情报学 >> 情报学

【目的】拓展以物种为中心的植物物种多样性抽取框架, 探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究, 以物种为中心, 设计包含多种实体及实体间关系的知识抽取框架, 利用已有的众多专业数据库, 设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架, 探索实现多种实体及实体间关系的语义知识抽取方法, 拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大, 且实体间关系的类型局限于共现、上下位类、语法关系几类, 还需进一步研究。【结论】本研究拓展了植物物种多样性抽取内容和思路, 可有效支持语义检索、科学计算。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量665下载量464 评论 0

2. chinaXiv:201711.01999 [pdf]

植物物种多样性语义知识抽取研究

刘建华; 王颖; 张智雄; 李传席
分类: 图书馆学、情报学 >> 情报学

【目的】拓展以物种为中心的植物物种多样性抽取框架, 探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究, 以物种为中心, 设计包含多种实体及实体间关系的知识抽取框架, 利用已有的众多专业数据库, 设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架, 探索实现多种实体及实体间关系的语义知识抽取方法, 拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大, 且实体间关系的类型局限于共现、上下位类、语法关系几类, 还需进一步研究。【结论】本研究拓展了植物物种多样性抽取内容和思路, 可有效支持语义检索、科学计算。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量630下载量453 评论 0

3. chinaXiv:201606.00100 [pdf]

网络科技信息监测中富文档识别与信息提取技术研究

张敏; 刘建华; 谢靖
分类: 图书馆学、情报学 >> 情报学

本论文围绕富文档载体类型的鉴别、元数据的提取等开展相应的实际应用探索。笔者通过开源工具PDFBox以及Tika对不同类型的富文档元数据及正文内容进行提取,取得了很好的实际效果,为科研人员提供了大量的有学术价值的情报资源。但是由于开源工具的局限性以及富文档特殊的文档结构,导致提取出来的元数据及正文内容准确率欠缺完美,笔者后续将对此进行研究并完善改进。

提交时间: 2016-06-13 点击量6476下载量594 评论 0

4. chinaXiv:201606.00098 [pdf]

实体名称规范的研究探索

刘建华; 郭红梅
分类: 图书馆学、情报学 >> 情报学

本文以文本处理中的基本任务之一--实体名称规范为主题,阐明了实体名称规范中两[摘要]本文以文本处理中的基本任务之一--实体名称规范为主题,阐明了实体名称规范中两种类型的任务,一个实体多个名称的实体共指消解问题和一个名称指代不同实体的实体歧义问题,结合这两类任务,综合分析了当前的相关研究成果,重点介绍了当前解决实体名称规范时典型的思路与方法,推动实体名称规范研究的重要的项目与重要评测会议,并结合当前研究中仍存在的问题,分析探讨了实体名称规范的研究趋势。

提交时间: 2016-06-12 点击量6220下载量643 评论 0

5. chinaXiv:201606.00096 [pdf]

保存元数据的发展趋势研究

刘建华; 张智雄
分类: 图书馆学、情报学 >> 图书馆学

数字资源长期保存中,保存元数据是支持数字资源长期可生存能力、可呈现能力、可理解能力、真实性、一致性的重要信息。为了全面了解保存元数据的最新发展,为国内从事长期保存的机构制定长期保存元数据的实施策略、建设方案提供参考,笔者综合分析了长期保存领域核心理论标准、重要会议和重要项目的研究进展,总结归纳了保存元数据在权利元数据,重要属性元数据,特殊类型数字资源及学科化特色的保存元数据、保存元数据的语义化、起源元数据等方面的重要发展趋势。

提交时间: 2016-06-12 点击量704下载量262 评论 0

6. chinaXiv:201606.00093 [pdf]

生物多样性语义知识抽取研究探索

刘建华
分类: 图书馆学、情报学 >> 情报学

[目的]拓展以物种为中心的生物多样性知识抽取框架,探索实现语义知识抽取方法 [方法]结合当前生物多样性抽取的主流研究,以物种为中心,设计包含多种实体及实体间关系的知识抽取框架,利用已有的众多专业数据库,设计并实现相应的识别方法。 [结果]设计了以物种为核心的知识抽取框架,探索实现了多种实体及实体间关系的语义知识抽取方法,拓展了生物多样性领域抽取内容和思路。 [局限]本研究实体识别的完整性和准确性受底层知识库影响较大,且实体间关系的类型局限于共现、上下位类、语法关系几类,还需进一步研究。 [结论] 拓展了生物多样性领域抽取内容和思路,可有效支持后续的语义检索、科学计算。

提交时间: 2016-06-12 点击量6120下载量350 评论 0

7. chinaXiv:201604.00959 [pdf]

生物多样性语义知识抽取研究探索

刘建华; 王颖; 张智雄; 李传席
分类: 图书馆学、情报学 >> 文献标引与编目

[目的]拓展以物种为中心的生物多样性知识抽取框架,探索实现语义知识抽取方法。[方法]结合当前生物多样性抽取的主流研究,以物种为中心,设计包含多种实体及实体间关系的知识抽取框架,利用已有的众多专业数据库,设计并实现相应的识别方法。[结果]设计了以物种为核心的知识抽取框架,探索实现了多种实体及实体间关系的语义知识抽取方法,拓展了生物多样性领域抽取内容和思路。[局限]本研究实体识别的完整性和准确性受底层知识库影响较大,且实体间关系的类型局限于共现、上下位类、语法关系几类,还需进一步研究。[结论] 拓展了生物多样性领域抽取内容和思路,可有效支持后续的语义检索、科学计算。

提交时间: 2016-04-28 点击量1189下载量805 评论 0

8. chinaXiv:201604.00018 [pdf]

基于 OSTP 特色主题资源分析奥巴马政府科技政策关注的重点

郭红梅; 刘建华; 张智雄
分类: 图书馆学、情报学 >> 图书馆学

时时更新的网络资源蕴含着丰富的信息,对OSTP网站上2010年2月以来的36个特色主题从领域分布、出现时间和存在时长进行统计分析,按领域对特色主题下的124份重要报告内容进行深度解读,以揭示奥巴马政府近5年来的发展重点和政策导向作用,以期为中国未来的发展提供参考信息。

提交时间: 2016-04-12 点击量538下载量389 评论 0

9. chinaXiv:201601.00056 [pdf]

构建STKOS术语发布与共享服务平台

付鸿鹄; 张智雄; 刘建华; 钱力; 王颖
分类: 图书馆学、情报学 >> 图书馆学

【目的】设计并实现 STKOS术语发布与共享服务系统。【应用背景】作为一个超级词表, 科技知识组织体系(STKOS)需要提供给用户使用从而推进知识服务, 促进知识共享, 为此需通过一个共享服务平台对其进行发布。【方法】在对国际上相关项目和系统进行调研的基础上, 结合 STKOS的特点和应用需求, 设计系统的功能框架, 并对系统实现中的关键问题包括应用场景、数据交换格式、数据结构、可视化、多版本管理等进行分析, 完成系统的整体建设。【结果】在千万量级数据场景下, 实现 STKOS术语发布与共享服务系统平台。【结论】本系统支持 STKOS数据的管理、发布, 支持对知识体系内容的揭示, 为用户提供对知识组织体系的浏览、检索和个性化定制下载。

提交时间: 2016-01-25 点击量2871下载量1054 评论 0

  [1 页/ 9 条记录]