您选择的条件: 曾建勋
  • 科研机构名称归一化实现

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》

    摘要: [目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。

  • 数字图书馆学者库构建方式研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 从数字图书馆资源利用与整理角度出发设计学者数据识别与学者数据库的构建方式,帮助提升数字图书馆资源建设效率与特色服务。[方法/过程] 从学者遴选与收录来源、学者描述内容及其框架、学者库构建与学者库应用方式四个方面调研国内外学者库研究及实践情况。通过分析学者特征属性,研究学者数据结构化表达方式,提出基于数字图书馆的学者库构建流程和总体框架。[结果/结论] 提出学者库构建与应用齐头并进的推进策略,强调学者库要融入科研管理过程,发动学者参与建设,增加展示与宣传效果,与人才识别相结合,服务于团队和专题资源建设;与知识管理相结合,兼顾学者存档与学者画像功能,拓展精准服务功能。

  • 基于合作网络的学者动态学术影响力模式识别研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】利用高合作学者识别算法和学者影响力模式识别算法识别出团队的高合作学者以及其动态学术影响力模式, 为团队中人才成长提供参考。【方法】根据学者的合作人数情况, 区分出团队中的高合作学者; 利用高合作学者的发文量和度数中心度指标测度学者的个人影响力和在团队的影响力, 识别学者的动态学术影响力模式。【结果】不同团队中的高合作学者数量不一, 为零至多个。高合作学者的动态学术影响力模式不同, 识别为稳步增长或成熟波动模式。【局限】仅利用两个指标来测度学者影响力, 对于较复杂情况的学者需引入更多的指标识别其动态学术影响力模式。【结论】高合作学者识别算法和学者影响力模式识别算法能够较合理地识别出团队中的高合作学者及其动态学术影响力模式。