• 国内外数据重用研究述评

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2022-09-19

    摘要:摘要: 目的/意义]对国内外数据重用研究现状进行系统梳理,总结分析其呈现的特点与不足,并为未来数据重用相关研究提供借鉴。[方法/过程]运用文献调研法获取国内外数据重用相关研究文献,并基于内容分析法对其进行分类,总结当前数据重用研究所呈现的特点和存在的不足, 并提出后续研究建议。[结果/结论]现有数据重用研究在避免重复数据收集、提高数据使用效率和促进研究人员数据共享方面发挥了一定的作用,并且逐步关注了更广泛的用户群体、拓展和延伸了研究的学科和领域、关注的数据重用研究类型更加多元化;但总体研究方向较为狭窄、研究方法相对局限、研究数量相对稀少。未来数据重用研究领域,应进一步拓宽研究的用户群体、更关注社会经济发展过程中产生的新问题、更关注大数据时代对数据重用研究提出的新要求,进一步推动更有效和更可靠的数据重用研究,为科技创新、社会进步、国家发展贡献力量。

  • 中文领域专业术语层次关系构建研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要:【目的】对如何从中文非结构化文本获取术语的层次关系进行探讨。【方法】从CNKI 获取数字图书馆学科领域文献, 通过术语抽取、术语向量空间模型构建、BIRCH 算法聚类和聚类标签确定构建术语的语义层次结构。【结果】构建数字图书馆领域术语的层次结构, 并对构建结果进行验证, 聚类正确率达到80.88%, 类标签抽取正确率达到89.71%。【局限】对构建效果的验证是通过随机抽样进行的, 且仅与一种其他构建方法进行实证比较。【结论】应用BIRCH 算法聚类构建术语层次结构, 该方法与K-means 聚类方法相比具有明显优势, 具备较高的执行效率和聚类有效性。