您选择的条件: 张云秋
  • 基于本体的研究主题语义分析方法研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]旨在深入语义层面对研究主题进行分析。[方法/过程]提出基于本体的研究主题语义分析方法,从语义类型和与语义关联两个维度展开,并在实证研究过程中,以医学信息学为例,对方法进行验证。[结果/结论]结果表明,语义类型分析能够辅助研究者对研究主题的内容进行进一步的语义理解;语义关联分析从语义角度分析各个研究主题在语义含义上的关联,在辅助研究者分析某领域研究主题时,能够综合分析相关主题,并发现新的研究交叉点。

  • 近年来知识融合研究进展与趋势

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]对近年来知识融合相关研究进行梳理与评价,以期为今后相关研究提供参考。[方法/过程]首先解析知识融合的概念,然后对知识融合的框架、过程和方法进行梳理,继而总结知识融合的研究趋势,最后进行研究展望。[结果/结论]知识融合研究在大数据环境下呈现出新的研究特点,但还不能满足大数据环境的要求,未来应从构建分层多维立体的大数据知识融合框架、提高知识融合的效率、构建实时动态融合机制、开展大数据实证应用研究4个方面开展知识融合研究。

  • 基于微博的细粒度情感分析

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】对微博进行细粒度情感分析, 将情感分为 8 类, 并计算其情感强度值, 从而尽可能还原微博用户 情感。【方法】通过微博语料分析构建疑问词词表, 在大连理工大学情感词汇本体 DUTIR 的 7 类情感基础上, 丰 富一类情感“疑”, 并利用点互信息法构建表情符号词典, 还综合考虑否定词和程度副词对情感表达的影响, 利用 Python 从新浪微博上获取数据, 并用 R 语言的 jiebaR 包进行分词, 对情感进行分类并计算其强度。【结果】得到 微博用户对于糖尿病 7 类常用药物的 8 类情感占比及情感强度, 并通过正确率、召回率、F 值对结果进行验证, 其 中“怒”和“哀”的正确率最高, 分别为 85.73%和 83.05%, 而“乐”和“好”的召回率与 F 值均最高, 为 81%以上。本文 新增情感“疑”的正确率、召回率、F 值分别为 77.33%、78.58%、77.95%, 均值在 8 类情感中排名前列, 说明其情 感识别较好。【局限】由于本文依赖于情感词典进行情感分析, 因此为了更好的分析结果, 情感词典仍需进一步 完善。【结论】本方法具有较高的识别率和可靠性, 能够更好地对微博上的情感分类进行细粒度分析。

  • 基于微博的细粒度情感分析

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】对微博进行细粒度情感分析, 将情感分为 8 类, 并计算其情感强度值, 从而尽可能还原微博用户 情感。【方法】通过微博语料分析构建疑问词词表, 在大连理工大学情感词汇本体 DUTIR 的 7 类情感基础上, 丰 富一类情感“疑”, 并利用点互信息法构建表情符号词典, 还综合考虑否定词和程度副词对情感表达的影响, 利用 Python 从新浪微博上获取数据, 并用 R 语言的 jiebaR 包进行分词, 对情感进行分类并计算其强度。【结果】得到 微博用户对于糖尿病 7 类常用药物的 8 类情感占比及情感强度, 并通过正确率、召回率、F 值对结果进行验证, 其 中“怒”和“哀”的正确率最高, 分别为 85.73%和 83.05%, 而“乐”和“好”的召回率与 F 值均最高, 为 81%以上。本文 新增情感“疑”的正确率、召回率、F 值分别为 77.33%、78.58%、77.95%, 均值在 8 类情感中排名前列, 说明其情 感识别较好。【局限】由于本文依赖于情感词典进行情感分析, 因此为了更好的分析结果, 情感词典仍需进一步 完善。【结论】本方法具有较高的识别率和可靠性, 能够更好地对微博上的情感分类进行细粒度分析。