• 基于LDA模型的国内档案学及演化研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-02-09

    摘要: [目的/意义]采用LDA模型发现近年来我国档案学的研究热点和发展趋势,为我国档案学主题研究提供数据支撑和参考价值。[方法/过程]选取2012年-2022年间9本档案学核心期刊的中文摘要为分析样本,以中国知网数据库(CNKI)为来源数据库,通过Python的开源工具包pkuseg进行中文分词,gensim搭建LDA模型,pyLDAvis将各主题基于web的交互式可视化。根据pyLDAvis可视化结果为主题命名,根据文档-主题概率分布情况并结合时间项分析热点主题和主题演化过程。[结果/结论]根据LDA模型能够有效地区分国内档案学领域研究的主题。2012-2022年国内档案学领域有14个主题,其中热点主题有5个;3个主题呈上升趋势,1个主题呈下降趋势,10个主题呈不同程度的波段趋势。

  • 预印本与期刊相似主题热点对比分析 ——以新冠疫情主题为例

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-07-03

    摘要: 【目的】对比分析预印本与期刊相似主题的区别与联系,以新冠疫情主题为例证明二者在研究热点与侧重上存在互补。【方法】本文采用BERTopic主题分析模型,并提出了二维象限主题对比法,从热度、影响两个维度对预印本与期刊两个来源的相似热点主题进行对比。【结果】分析bioRxiv、medRxiv、Scopus平台上新冠疫情相关文献共约七万条,对比预印本和期刊各个维度的主题分布情况,发现以下规律:1)主题热度方面,预印本更偏向医学层面,期刊更偏向社会层面;2)主题影响方面,预印本更偏向预防主题,期刊更偏向病毒传播主题;3)预印本和期刊在热度和影响力方面有部分重回主题,如疫苗相关主题;4)预印本中有期刊中所没有的特有的热点主题,如病毒变异等。【结论】总体来看,预印本的主题更偏向理论与学术,而期刊主题更偏向实践与社会;预印本主题在原理方面分支更细致,而期刊主题在社会层面涉及面更广,二者在内容方面可以形成有效互补。

  • 跨学科视角下基因工程领域热点交叉主题识别及主题演化分析

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2024-01-26

    摘要: 为了更加精准把握交叉学科研究热点与发展态势,本研究提出一种计算主题学科交叉度的方法,并结合主题强度来综合识别热点交叉主题、对交叉主题未来发展进行预测。本研究选取Web of Science数据库2000-2019年基因工程领域论文进行实证分析,首先采用LDA模型挖掘主题,然后通过计算主题强度和主题学科交叉度识别热点交叉主题,最后划分时间窗口,绘制主题强度及主题学科交叉度的变化趋势图并对结果展开分析。实证结果表明:基因工程领域共有21个重要主题,其中7个热点主题,14个学科交叉主题,2个热点交叉主题;根据主题强度变化趋势,将21个主题划分为3个上升型主题,7个下降型主题和11个平稳型主题,大部分主题的学科交叉程度呈现上升趋势。