您选择的条件: 王文玲
  • 网络存档数据质量保证策略理论框架研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [ 目的 / 意义 ] 数据质量保证工作是网络存档工作中的一项重要工作,其贯穿整个网络存档工作 的始终,决定网络资源存档工作的成败。[ 方法 / 过程 ] 通过对国内外各保存机构的质量保证策略及方法 进行分析、研究和对比,提出数据质量保证的策略理论框架。[ 结果 / 结论 ] 该框架以数据为中心,制定 一系列的业务标准及工作规范,利用现有软件工具开展全流程的数据质量检查工作,同时以团队建设、运 行环境维护及授权获取网站备份作为补充手段,确保获取高质量的存档数据。

  • 词汇链文本表示模型计算方法综述

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [ 目的 / 意义 ] 词汇链文本表示方法是一种通过词汇链对语篇中的词汇衔接关系进行建模的文本 表示方法,该方法能够体现语篇中丰富的语义信息,在自动摘要、文本切分等领域得到广泛应用。[ 方法 / 过程 ] 对词汇链相关研究论文进行收集和整理,对词汇链的构建方式和消歧方法进行了归纳。词汇衔接 关系的计算方法包括基于语义关联的计算方法、基于统计信息的计算方法和基于图的计算方法。词汇链构 建过程中的语义消歧是很重要的过程,直接影响词汇链的构建结果和效率。[ 结果 / 结论 ] 词汇链文本表 示方法结构简单、应用范围广泛。词汇链文本表示模型还存在着一些问题,如使用词典构建存在很多局限性, 没有完整考虑上下文的信息等。未来词汇链模型可能会向着融合语义关系方法和统计算法、使用分布式语 义加强对上下文分析等方向发展。

  • 一种分布式语义增强的词汇链文本表示模型构建方法

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】利用分布式语义关联计算词衔接关系, 解决目前词汇链构建时存在的词间关系探测深度不够等问 题, 提高词汇链构建质量。【方法】对词汇链构建的技术方法进行归纳, 利用 WordNet 词典关系来计算文本中语 言单元的语义关联, 利用分布式记忆模型来计算语言单元之间的潜在语义关系, 将这两种语义关系结合起来实 现词汇链文本表示模型的构建。同时在理论研究的基础之上选择医学领域科技论文进行对比实验。【结果】在文 本主题描述方面, 本文方法的词汇链构建结果要优于非贪婪算法, 算法耗时与非贪婪算法相当。【局限】算法耗 时较长; 没有完整考虑词衔接关系; 只在对医学领域科技文献的主题识别中验证了该方法的有效性, 还需要在 更多领域进行证明。【结论】分布式语义关联可以识别潜在语义, 对使用多元短语构建词汇链也有较大的帮助, 能 有效地增强词汇链构建效果。