分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-02-09
摘要: [目的/意义]采用LDA模型发现近年来我国档案学的研究热点和发展趋势,为我国档案学主题研究提供数据支撑和参考价值。[方法/过程]选取2012年-2022年间9本档案学核心期刊的中文摘要为分析样本,以中国知网数据库(CNKI)为来源数据库,通过Python的开源工具包pkuseg进行中文分词,gensim搭建LDA模型,pyLDAvis将各主题基于web的交互式可视化。根据pyLDAvis可视化结果为主题命名,根据文档-主题概率分布情况并结合时间项分析热点主题和主题演化过程。[结果/结论]根据LDA模型能够有效地区分国内档案学领域研究的主题。2012-2022年国内档案学领域有14个主题,其中热点主题有5个;3个主题呈上升趋势,1个主题呈下降趋势,10个主题呈不同程度的波段趋势。