按提交时间
按主题分类
按作者
按机构
  • “一带一路”智库报告主题挖掘与演化研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-06-13

    摘要: 目的/意义 作为国家软实力和话语权的重要组成部分,智库对政府决策、企业发展、社会舆论与公共知识传播等方面具有深刻影响。在对一带一路合作倡议的认知上,智库以及智库专家的研究成果,在对外合作、舆论导向、项目评估等方面发挥着重要作用,同时也能够反映一带一路合作倡议的工作重点等信息。本文通过量化研究中国智库对一带一路倡议研究的主题分布与演化历程,得到一带一路倡议在中国智库视角下的重点关注、研究方向和研究发展脉络,为一带一路倡议相关研究的推进提供整理与参考。 方法/过程 本文结合LDA2vec主题模型与词向量语义相似度计算方法,对于《全球智库报告2020》榜单中的中国智库,在20132020年间关于一带一路倡议研究的3,052份报告进行主题挖掘以及主题演化研究,并进行可视化呈现,分析主题内容与演化特征。 结果/结论 我国智库对一带一路倡议的研究热点主题逐年覆盖政治、经济、文化、社会、军事、环境等领域,且研究热点有着鲜明的基调,如互利互信互联互通命运共同体共赢等,主题演变的过程体现出明显的主题继承性、主题融合性等特征,这也体现出一带一路倡议逐渐全面的发展过程,也能够说明国内智库对一带一路倡议的研究重点具有持续性和拓展性。

  • Prophet预测-修正的主题强度演化模型——以干细胞领域为实证

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 主题演化对科技前沿探测、创新战略部署具有十分重要的作用。[方法/过程] 将主题演化分析过程分解为主题的表示、相似性关联和强度演化计算几个步骤,提出一种主题强度演化与预测模型,使用LDA模型进行主题的表示,提出内容、共现和趋势相似度等维度进行主题关联计算,引入基于Prophet的预测-修正模型进行主题演化趋势预测。并以干细胞领域为例,进行演化的实证分析。[结果/结论] 实验表明,对每个研究主题采用Logistic增长模型进行预测R2Score都达到0.90以上,表明Prophet中的Logistic增长模型与该领域主题增长趋势规律相符合,能够较好地拟合主题强度的演化趋势。提出的主题演化模型对专业领域内主题分布与演化分析有一定的借鉴意义。

  • 基于LDA模型的国内档案学热点主题及演化研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-02-09

    摘要: [目的/意义]采用LDA模型发现近年来我国档案学的研究热点和发展趋势,为我国档案学主题研究提供数据支撑和参考价值。[方法/过程]选取2012年-2022年间9本档案学核心期刊的中文摘要为分析样本,以中国知网数据库(CNKI)为来源数据库,通过Python的开源工具包pkuseg进行中文分词,gensim搭建LDA模型,pyLDAvis将各主题基于web的交互式可视化。根据pyLDAvis可视化结果为主题命名,根据文档-主题概率分布情况并结合时间项分析热点主题和主题演化过程。[结果/结论]根据LDA模型能够有效地区分国内档案学领域研究的主题。2012-2022年国内档案学领域有14个主题,其中热点主题有5个;3个主题呈上升趋势,1个主题呈下降趋势,10个主题呈不同程度的波段趋势。

  • 软件开源主题识别及演化分析

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-28

    摘要: [目的/意义] 软件开源是社会化软件生产中一种重要的生产组织方式和协同创新运动。通过对国内外软件开源相关研究的主题识别及演化分析,探究软件开源研究领域的阶段性热点和趋势变化规律,为以促进中国软件开源创新进一步优化发展为主旨的学者开展研究梳理方向。[方法/过程] 以从Web of Science数据库检索到的2001年至2023年5月10日期间的软件开源领域文献作为语料库,采用困惑度指标确定主题数目,训练LDA主题识别模型得到主题-词分布和文档-主题分布,根据主题-词分布对主题进行标识,依据文档-主题分布计算主题强度,进而识别热点主题和归纳演化路径。[结果/结论] 主题识别结果表明,软件开源研究领域存在六个重要主题,分别是贡献动机、商业模式、开源治理、协作模式、开源协议、企业参与;从主题演化角度上看,软件开源在商业模式、开源治理和企业参与主题上近年来具有相对较高的研究热度,开源协议的研究趋势相对稳定,贡献动机和协作模式的研究热度虽然呈相对下降趋势,但自始至终一直保持较高的受关注度。软件开源研究呈现由关注开源动机自发、自治的个人维度到企业、政府参与的组织维度的发展规律。建议学者们关注中国情景下开源生态各类主题研究,为我国开源生态健康发展提供理论支持。

  • 技术保护与监管视角下的颠覆性技术政策研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2022-09-04

    摘要: 摘要: 目的/意义 从我国对颠覆性技术的保护和监管需求出发,通过挖掘世界科技强国不同时期的颠覆性技术政策关注焦点和演进特征,为我国政策发展方向提供借鉴。 方法/过程 基于1990-2020年间的颠覆性技术政策文件集,通过LDA模型探索政策主题焦点分布,并引入时序因素构建DTM模型分析不同时期的政策主题内容和强度的演化情况,总结科技强国的关键政策经验。 结果/结论 本研究将科技强国的颠覆性技术政策发展划分为7个时期。研究发现,保护和监管视角下的政策焦点演化均存在衰减型、增长型和波动型3类。相对而言,在保护型政策主题更具集中性和连贯性,存在明显的领导型主题阶段发展规划;监管视角则没有固定的领导型主题,但主题融合范围更大,其中跨域监管合作是将各主题紧密关联的重要角色。

  • 我国文献资源保障体系论文主题识别与演 化分析

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [ 目的 / 意义 ] 对我国文献资源保障体系论文主题演化的路径进行分析,为重构我国文 献资源保障体系提供借鉴。[ 方法 / 过程 ] 主要使用 LDA 模型对所搜集到的文献进行聚类,首 先以时间段为划分依据,绘制主题词共现网络,探索各主题之间的交互关系,后通过相似度计 算判定各主题内部的演化路径并绘制桑基图以可视化形式展现演化结果。[ 结果 / 结论 ] 研究 发现我国文献资源保障体系的相关主题在 2000 年左右均已基本出现,主题主要包含资源角度和 机构角度两大类,且受计算机技术和国家政策影响较大,并针对该两大类主题,给出相应的对 策与建议。

  • 基于共词和Word2Vec加权向量的文献-主题语义匹配分析方法

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义]共词分析作为主题识别的重要方法,存在一定的局限和不足,将Word2Vec加权向量与共词分析相结合,有利于明确具体文献的主题归属,更好地对主题的发展演化进行分析。[方法/过程]在运用共词分析进行主题聚类的基础上,通过Word2Vec加权向量分别计算文献向量与聚类主题向量,并基于余弦相似度进行文献与主题的语义匹配。[结果/结论]国内外知识共享领域的实证分析表明,该方法能较好地将相关文献匹配至对应主题,并能从文献层面对主题特征及发展演化进行动态分析。

  • 跨学科视角下基因工程领域热点交叉主题识别及分析

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2024-01-26

    摘要: 为了更加精准把握交叉学科研究热点与发展态势,本研究提出一种计算主题学科交叉度的方法,并结合主题强度来综合识别热点交叉主题、对交叉主题未来发展进行预测。本研究选取Web of Science数据库2000-2019年基因工程领域论文进行实证分析,首先采用LDA模型挖掘主题,然后通过计算主题强度和主题学科交叉度识别热点交叉主题,最后划分时间窗口,绘制主题强度及主题学科交叉度的变化趋势图并对结果展开分析。实证结果表明:基因工程领域共有21个重要主题,其中7个热点主题,14个学科交叉主题,2个热点交叉主题;根据主题强度变化趋势,将21个主题划分为3个上升型主题,7个下降型主题和11个平稳型主题,大部分主题的学科交叉程度呈现上升趋势。

  • 技术研究方法综述

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [ 目的 / 意义 ] 技术主题演化分析对于理解技术发展脉络、预测技术未来发展趋势具有重要意义, 梳理技术主题演化分析方法有助于了解其研究现状,并为进一步研究奠定基础。[ 方法 / 过程 ] 将现有研 究中技术主题演化分析方法分为定性、定量和定性与定量相结合的三大类方法,并对每类方法中有代表性 的方法进行阐述。[ 结果 / 结论 ] 在对技术主题演化分析现有方法进行系统梳理的基础上,提出现有研究 的不足和对未来研究的展望。

  • 作者主题模型及其改进的方法与应用研究综述

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]作者主题模型作为近年来计算机领域关注度较高的新型概率模型,在文本挖掘与自然语言处理等方向已有广泛应用。分析国内外作者主题模型及其改进的思路与应用,更好地把握其研究现状,以期为计算机、图书情报等相关领域科研人员提供参考。[方法/过程]本文选取Web of Science核心数据库、DBLP及中国知网(CNKI)数据库作为文献来源,通过制定检索规则、去重及人工判读等操作提炼出关于作者主题模型及其改进方法的文献集,从模型应用过程的视角,结合文献分析法对现有研究进行总结归纳。[结果/结论]通过分析发现,现有相关研究已形成较为完整的分析流程,且模型的改进角度、适用领域也日益多样化。但性能优化、模型评价指标的规范完善以及在图书情报领域的进一步应用等方面仍有待深入探索。

  • 会话分析视角下非正式信息交流主题与主题簇演化分析

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 针对当前非正式信息交流主题演化研究在分析层次和测度指标两方面存在的局限,提出一种具有通用性的演化分析方法,从微观和中观层面探究主题演化特征与规律。[方法/过程] 引入会话分析理论,以新浪微博和知乎为例,通过对主题和主题簇运行过程进行分析,从会话内容和讨论方式两个维度揭示非正式信息交流演化特征与规律。同时,设计主题持续性计算判定方法,丰富主题演化的衡量标准。[结果/结论] 主题演化分析结果显示新浪微博和知乎意见群体的发文主题存在明显偏重,且表明了意见群体参与社会焦点事件讨论中观点的主要切入角度;主题簇演化分析发现了新浪微博意见群体在一定范围内发散探索多元主题、知乎意见群体始终关注聚焦核心主题的讨论特点。两个社交媒体中意见群体在会话内容和讨论方式方面的区别,喻示了新浪微博和知乎在网络环境的非正式信息交流中主要承担的角色差异。

  • 近三十年国际网络舆情领域的主题热点与演变研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-01-08

    摘要: 摘要: 目的/意义  对国际上近三十年网络舆情的主题热点与演变进行可视化研究,为我国学者理清国际网络舆情的发展脉络,快速发现该领域的研究核心与热点问题提供一定的参考。 研究设计/方法  通过Wos检索1993-2022网络舆情文献3084篇,使用VOSviewer进行性能分析和科学制图,以及使用SciMAT检查了三个连续时期关系的主题演变。 结论/发现  创建术语共线地图确定主要的术语类团,使用引用来源的共同引用发现具有影响力的期刊,使用引用参考文献的共同引文分析得到具有影响力的出版物,使用被引作者的共同引用分析和书目耦合链接得到有影响力的作者和国家,然后使用SciMAT得到了三个连续时期关系的主题演变。 创新/价值 使用科学制图和绩效分析对国际现有的网络舆情的研究进行了深度的刨析,科学制图可视化该领域的研究结构,绩效分析集中在各项目的指标上。

  • 面向情报研究的文本语义挖掘方法述评

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】对主要的文本语义挖掘方法及其在情报研究中的应用进行综述分析。【文献范围】集中选择近10年国内外主流的文本语义挖掘方法在情报研究领域的应用以及少数此前的代表性研究和文本语义挖掘方法的进展研究。【方法】分别概括介绍词、句子和篇章粒度的文本语义挖掘方法、算法, 并通过主题演化和技术挖掘领域的实际应用进行方法剖析。【结果】文本语义挖掘方法与传统的情报分析方法相比, 主要弥补了两个缺陷: 侧重于分析结构化的数据, 无法处理多种异构的数据源; 分析停留在统计语法层面, 没有深入到文本的语义信息。【局限】仅对主流的文本语义挖掘方法以及在科学研究领域的应用进行综述分析, 研究不全面。【结论】文本语义挖掘方法弥补了传统情报分析方法的不足, 是情报研究方法的重要发展方向, 随着方法的成熟, 下一步研究重点是外部语义资源的丰富。

  • 基于 BERTopic的突发事件微博舆情分析研究——以“东航Mu5735空难事件”为例

    分类: 图书馆学、情报学 >> 情报资料的处理 提交时间: 2024-04-18

    摘要: 目的/意义 :本研究旨在系统地分析突发事件微博舆情的主题演化趋势,可视化舆情发展过程中的焦点主题,为后续网络舆情的引导提供实践参考依据。 方法/过程 :采用BERTopic主题提取模型识别舆情发展不同阶段的主题,并采用余弦相似度度量主题间的相似性,可视化主题的演化路径。以新浪微博“东航Mu5735空难事件”为例,进行突发事件网络舆情的主题演化研究。 结果/结论: 实证研究结果表明,基于BERTopic主题模型对舆情事件建模得到高效且可观性较高的主题识别结果,准确把握舆情发展每个阶段中热点主题,揭示了舆情传播过程中主题演变过程。 创新/局限 :本研究提出了一种基于 BERTopic 模型对短文本突发事件微博舆情主题演化分析的总体框架,对主题提取后的结果进行主题内容演化分析并进行可视化展示。本研究的局限性在于当前选用的数据来源仅来源于微博平台,后续可提高数据来源的多样性。

  • 营商环境政策的研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [目的/意义]明确我国营商环境政策发展态势,揭示政策重点的时序演化规律,为后续政策的制定与完善提供数据支撑。[方法/过程]基于2001-2020年中央及各地方政府发布的营商环境政策文本,以两年为一个时间片,通过动态主题模型得到30个营商环境主题的时序演化分布,然后将主题归纳到市场环境、政务环境、人文环境和法律环境4个维度下,进而研究营商环境政策中各维度的主题强度及重点发展趋向。[结果/结论]营商环境政策主要集中于政务环境和市场环境建设,政策力度分配不均,且各维度强度在不同经济地区下差异显著,由此针对营商环境政策提出的建议包括:强化市场导向,减弱政务干预,引入法制规范,等等。

  • 多位态研究主题识别及其演化路径方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 科学主题演化路径对认识科学发展过程和预测未来发展趋势具有重要的意义。鉴于现有研究将演化路径上的主题同等看待的缺陷,提出一种新的多位态科学主题识别及其演化路径方法。[方法/过程] 以向心度和密度将每个时间区间的主题划分为核心-成熟型、边缘-成熟型、边缘-非成熟型和核心-非成熟型4种类型,并利用余弦相似度将不同时间区间的主题进行关联,以展示不同类型科学主题之间的动态交叉演化关系。[结果/结论] 以3D打印领域文献为例,从技术发展阶段、主题识别、主题类型划分和主题演化路径4个方面对3D打印技术发展过程进行测度,结果证明该方法对科学主题识别及其演化路径展示具有较好效果。

  • 基于非负矩阵分解的技术分析

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]分析技术主题演化过程可以梳理技术发展脉络,对于发展创新、预测技术发展趋势具有重要意义,但是从语义角度分析技术主题演化轨迹的研究较少。因此,从语义的角度出发,分析技术主题演化过程。[方法/过程]提出基于非负矩阵分解的改进的动态非负矩阵分解模型对专利文本进行动态主题建模,并利用TextRank算法抽取名词短语进行标注,增强所抽取技术主题的可解释性。在此基础上,利用词向量的方式计算技术演化轨迹,并进行可视化展示。[结果/结论]对2002年、2005年、2008年、2011年和2014年的五方专利进行实证分析,识别出65个技术主题及其演化轨迹,表明方法的可行性。

  • 重大突发事件中社会群体信息行为舆情图谱构建研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-07-20

    摘要: [目的/意义] 研究重大突发事件中社会群体信息行为舆情主题图谱构建,有利于更好地发现重大突发事件下舆情演进态势和识别敏感舆情话题,从而进行正向的舆情引导,对重大突发事件的应急和维护社会稳定具有重要作用。[方法/过程] 本文基于LDA构建社会群体信息行为舆情主题聚类演化图谱,基于时序性构建舆情主题热度演化图谱,基于相似度构建舆情主题路径演化图谱,并给出重大突发事件中社会群体信息行为舆情主题图谱构建过程模型。[结果/结论] 研究结果表明,利用本文构建的重大突发事件中社会群体信息行为舆情主题分析模型,可以对社交媒体中群体信息行为舆情主题特征、主题热度影响因素及主题最优传播路径进行分析。本文的研究为重大突发事件中社会群体信息行为舆情分析提供了新的理论框架和分析方法,为重大突发事件中的网络舆情引导和舆情治理提供参考。

  • 会话分析视角下的突发公共事件研究——以"新冠肺炎疫情"为例

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 会话分析理论的引入为主题演化研究提供了新的研究视角,细化了主题演化分析粒度。同时,更为完善的主题演化分析思路被应用于突发公共事件之中,有利于提升监管部门的舆情疏导效率。[方法/过程] 针对现有研究中的主题识别方法与主题演化判断标准,结合会话分析与主题分析,将会话内容与会话组织结构引入主题演化分析过程中,并以"新冠肺炎疫情"中用户生成内容(UGC)作为数据来源进行实证分析。通过基于时序性与讨论热度的主题演化分析,从主题强度层面识别不同层级内容的演化规律,并在主题内容分析层面引入知识发现的关联规则计算思想以挖掘语料内容间的参照关系,结合社会网络分析方法确定关键演化路径。[结果/结论] 研究结果表明,网络结构中不同层级的主题内容存在一定差异并对主题演化趋势有着重要影响,对有着重要作用的层级的内容进行有效监管会对引导舆情走向产生积极作用。

  • 基于流形学习的新闻主题关系构建和演化研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】通过对以互联网为媒介的新闻报道的主题演化研究, 分析新闻主题的产生、发展和演变过程, 把握媒体舆论方向。【方法】引入流形学习构建全局时间跨度的新闻主题关联关系, 挖掘由LDA 主题模型识别得到的各个时间窗口的高维主题向量间的关系, 在低维平面上实现主题聚类和相互关联的可视化, 提出利用社会网络理论指标分析主题的演化结果。【结果】利用2015 年美国有线电视新闻网对中国的新闻报道进行主题关系构建和演化, 结果表明该方法能够发现主题在全局时间跨度的演化趋势。【局限】时间窗口长度对主题演化的效果和可变时间窗口长度机制没有涉及。【结论】新闻主题演化分析方法能够在低维可视平面上描绘主题在全局时间跨度的演化, 避免主题由于相邻时间窗口关联失效而导致全局演化路径的断裂。