分类: 管理学 >> 科学学与科技管理 分类: 图书馆学、情报学 >> 情报资料的处理 提交时间: 2024-06-06
摘要: 目的 检验主要科技论文数据库的作者识别号的覆盖范围与准确性,并验证其能否直接用于科学学与科技政策的实证研究。方法 以825位华人科学家的发表论文为标准数据集,通过检索和收集科技论文数据库中科学家识别号及其论文信息,计算数据的覆盖率、准确性和稳健性,并运用双重差分法进行实验复现检验数据库的适用性。结果 第一,WOS、Scopus、AMiner和OpenAlex四个数据库可检索到90%以上的华人科学家识别符,ORCID覆盖率不足50%。第二,Scopus的准确性最高为85.2%,OpenAlex最低仅为51.2%;第三,直接使用数据库作者识别号的数据用于实证研究会引入不可忽视的误差。局限 准确集主要由青年科学家组成,学科层面未覆盖社会科学与人文科学,具有一定的局限性。结论 当前主要数据库的作者识别号还不能直接应用于大规模数据的实证研究,可通过建立标准化的科学家成果认证信息平台来提高中国作者姓名识别准确性。