• 共主题网络方法及应用

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】通过构建共主题网络, 对主题之间的关系进行分析, 优化主题包含的词项。【方法】将“文档–主 题”二分图依照加权投影规则生成共主题网络, 使用介数中心性和主题概率结合的方法测度共主题网络中重点主 题, 通过 GN 算法对主题网络进行社区分割, 使用相关度方法优化主题词项。【结果】将共主题网络与基于 JSD 的 K-means 方法进行比较发现, 两者在三种主题数(最优主题数 28 和随机主观主题数 20, 30)测试下产生的聚类 数目都相同, 聚类内容的一致程度分别达到 100%、95%、87%。【局限】其他社区分割方法共主题网络未能全面涉 及。【结论】共主题网络照顾到了高维数据的需要, 能够探查出文档中哪些主题是重要主题, 哪些主题联系紧密。

  • 基于BLAST文本重用的先秦诸子关系考察

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2024-01-10 合作期刊: 《文献与数据学报》

    摘要: [目的 / 意义]勾勒和分析先秦诸子的学术面貌,梳理诸子之间的关系,对发掘他们的传承和影响有很大帮助。[方法 / 过程]以文本重用(text reuse)为手段,首先构建引用网络,探析诸子文本的引用情况;然后,考察《孟子》和《荀子》对《论语》的引用,探析它们从《论语》中吸收和转化的思想;最后,考察《吕氏春秋》和《荀子》谁更符合集大成者。[结果 / 结论]引用网络中《韩非子》和《荀子》与其他诸子联系较多,说明先秦思想的现实主义立场。对《论语》的引用里,《孟子》注重德性的提升,《荀子》注重现实主义品格在精神形态的反映。从引用网络发现《吕氏春秋》比《荀子》更符合集大成者。

  • 《点石斋画报》主题演化分析

    分类: 图书馆学、情报学 >> 读者工作 提交时间: 2023-11-07 合作期刊: 《文献与数据学报》

    摘要: [目的 / 意义]《点石斋画报》作为中国最早的新闻类画报之一,具有重要史料价值。本文基于社会网络分析方法,挖掘《点石斋画报》中词项之间关联性,以揭示清末新闻类画报的重点关切。[方法 / 过程]首先,以《点石斋画报通检》为语料来源构建语料库;其次,以《点石斋画报》题跋为语义单元建立共词网络;接着,通过社区分割确立《点石斋画报》话语主题;最后,以主题中的核心关键词构建时序自我中心网,考察关键词的语义共生演化。[结果 / 结论]从研究结果看,《点石斋画报》呈现“海外新闻”“上海”“志怪奇闻”“中国妇女”“中国名人”“苏州”“疾病伤残”七个核心话语主题。以“中国妇女”一词为例,时序自我中心网显示“罪行”“命案”等司法类词项频次较高,并呈均匀分布状态,“婚姻”和“纳妾”作为新旧观念的指示词,其频次呈现强弱态势对比,体现出在中西文化对冲下新旧观念的共存与转换。研究结果也表明,社会网络分析方法可以有效弥补传统研究方法的某些缺憾。