您选择的条件: 祁瑞华
  • “一带一路”智库报告主题挖掘与演化研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-06-13

    摘要: 目的/意义 作为国家软实力和话语权的重要组成部分,智库对政府决策、企业发展、社会舆论与公共知识传播等方面具有深刻影响。在对一带一路合作倡议的认知上,智库以及智库专家的研究成果,在对外合作、舆论导向、项目评估等方面发挥着重要作用,同时也能够反映一带一路合作倡议的工作重点等信息。本文通过量化研究中国智库对一带一路倡议研究的主题分布与演化历程,得到一带一路倡议在中国智库视角下的重点关注、研究方向和研究发展脉络,为一带一路倡议相关研究的推进提供整理与参考。 方法/过程 本文结合LDA2vec主题模型与词向量语义相似度计算方法,对于《全球智库报告2020》榜单中的中国智库,在20132020年间关于一带一路倡议研究的3,052份报告进行主题挖掘以及主题演化研究,并进行可视化呈现,分析主题内容与演化特征。 结果/结论 我国智库对一带一路倡议的研究热点主题逐年覆盖政治、经济、文化、社会、军事、环境等领域,且研究热点有着鲜明的基调,如互利互信互联互通命运共同体共赢等,主题演变的过程体现出明显的主题继承性、主题融合性等特征,这也体现出一带一路倡议逐渐全面的发展过程,也能够说明国内智库对一带一路倡议的研究重点具有持续性和拓展性。

  • 新冠肺炎疫情相关政策扩散特征与主题挖掘研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-06-13

    摘要: 目的/意义 新型冠状病毒肺炎疫情期间,我国政府出台的各类政策在疫情防控、国家调整等方面发挥着重要作用,本文通过研究新冠肺炎疫情相关政策的扩散特征和热点主题,从时间和内容两个方面探寻重大公共卫生事件下,政府政策的扩散机制和主题特点,为智库等相关研究机构研究突发事件的相关政策及其时间分布与内容主题的扩散特征提供借鉴和参考。 方法/过程 本文结合政策扩散和主题挖掘理论与方法,对2020年495条政府机构颁布的新冠肺炎疫情有关政策按照政策类型进行分类,采用时间维度研究法、主题词抽取法和社会网络分析法进行扩散特征分析,并挖掘热点主题。 结果/结论 政府颁布的疫情防控政策可分为法律法规、经济调控和文化活动三类,这三类政策从中央到省市级扩散的时间变化呈现明显的先波动后稳定的特征,体现了国家对新冠肺炎疫情的重视和政策调控的高效性。三类政策的中心主题一致,且在政策扩散过程中得到了较好的传递,三类政策主题继承、创新程度存在差异,政策主题均存在着密切关联。

  • 基于依存关系的中文微博作者性别识别

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】针对网络文本篇幅短小、传统文体特征集稀疏等特点, 探讨依存关系在中文微博作者性别识别中的应用。【方法】选取腾讯公开微博作为实验语料, 抽取依存关系特征与现有文献中的词汇特征、结构特征、功能词特征、词性标注特征和微博特征进行对照实验。【结果】采用支持向量机、朴素贝叶斯、最近邻和决策树算法的对照实验验证了本文方法在中文微博作者性别识别任务中的准确率、召回率和F-Measure 最高。【局限】依存关系在微博作者性别识别中的有效性还需在大规模语料上进一步验证。【结论】本文模型能够避免短文本特征集的稀疏性, 与其他对照特征集相比, 能更有效地识别作者性别。

  • 基于依存关系的中文微博作者性别识别

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】针对网络文本篇幅短小、传统文体特征集稀疏等特点, 探讨依存关系在中文微博作者性别识别中的应用。【方法】选取腾讯公开微博作为实验语料, 抽取依存关系特征与现有文献中的词汇特征、结构特征、功能词特征、词性标注特征和微博特征进行对照实验。【结果】采用支持向量机、朴素贝叶斯、最近邻和决策树算法的对照实验验证了本文方法在中文微博作者性别识别任务中的准确率、召回率和F-Measure 最高。【局限】依存关系在微博作者性别识别中的有效性还需在大规模语料上进一步验证。【结论】本文模型能够避免短文本特征集的稀疏性, 与其他对照特征集相比, 能更有效地识别作者性别。

  • 作者身份识别中不规范文本特征选择方法的研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】从不规范文本中提取特征, 识别网络文本作者身份。【方法】提出两种在不规范文本中提取特征的方法: 利用在Jaccard 系数的基础上定义的不规范文本相似度M; 利用不规范文本在文本中出现的次数。【结果】两种特征的识别正确率分别达到85.1%和80.2%, 加入这两种特征后, 传统的基于统计值特征的分类器识别正确率分别提高5.8%和4%。【局限】只考虑到网络文本在词汇层面的不规范性, 并没有针对更高层面的特性进行研究, 如句法层面、结构层面。【结论】本文提出的特征提取方法, 可以有效地提取不规范文本特征, 有助于作者身份识别系统识别正确率的提升。