分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】通过采用语义识别、知识关系计算等方法提升科技文献检索系统的服务功能和效果, 使之能够呈现更加丰富的知识化语义信息, 将更多的知识点和知识关系展现给用户。【方法】应用数据挖掘和关系计算工具,深度识别和抽取科技文献中的语义知识, 分析、计算、构建语义关系, 并将得到的语义知识和语义关系建立多维语义索引树, 设计新的数据组织呈现模型。【结果】研发语义丰富化检索示范系统, 在科技文献检索应用过程中充分揭示语义信息, 丰富检索体验。【局限】选取的试验数据集合不够充足, 缺少其他领域应用对比。【结论】本文模型设计给用户带来更多的知识层面的关联、揭示和导航, 提升了检索系统体验。同时分析了设计模型的不足之处, 探索改进方法。
分类: 图书馆学、情报学 >> 文献学 提交时间: 2017-08-21
摘要: [目的/意义]本文期望通过采用数据挖掘、语义识别、知识关系计算等技术方法来提升科技文献检索系统的服务功能和效果,使之能够呈现更加丰富的知识化语义信息,将更多的知识点和知识关系展现给用户。[方法/过程] 本文应用semrap和clausIE数据挖掘和关系计算工具,识别和抽取科技文献中的语义对象,分析、计算、构建语义关系,并将得到的语义对象和语义关系设计建立多维语义索引树,设计了新的数据组织呈现模型。[结果/结论] 研发语义丰富化检索示范系统,在科技文献检索系统中充分揭示语义信息,给用户带来更多的知识内容层面的导航、关联、发掘和揭示,同时分析了设计模型的优势与不足。
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2016-11-14
摘要: 梳理科技资源中缩略语的构成形式;提出一种基于逆序快速扫描和共现分析相结合的术语缩略语快速提取算法。首先从科技资源中提取缩略语、候选全称及上下文信息;接着采用启发式模糊匹配算法,对缩略语及候选术语全称从右向左进行逆序扫描,在不要求缩略语中字母全部正确匹配的情况下,识别出规则的术语缩略语及其全称;最后对不规则候选缩略语及全称进行共现分析。同以往算法相比,该算法无论在时间复杂度上,还是在准确率和召回率上都取得了明显进步。