您当前的位置:首页 > 论文浏览
您选择的条件: 毕强(5)

1. chinaXiv:201711.02009 [pdf]

基于语义相似度的文本聚类研究

毕强; 刘健; 鲍玉来
分类: 图书馆学、情报学 >> 情报学

【目的】为解决传统的文本聚类无法充分挖掘文本资源语义信息以及相似度矩阵高维性、稀疏性等问题,并进一步改善文本聚类质量, 提出基于语义相似度的文本聚类方法。【方法】通过《同义词词林扩展版》计算词语的语义相似度并得到文本语义相似度矩阵, 根据文本语义相似度矩阵进行谱聚类, 将文本聚集为文本簇。【结果】利用复旦大学文本语料库与搜狗文本语料库中的文本资源作为数据来源分别对传统聚类算法与本文提出的算法进行实验, 结果表明, 当聚类个数为10 时, 本文算法的准确率最高, 并且Purity 值高于传统聚类算法的Purity 值。【局限】《同义词词林扩展版》中包含的领域术语不完整, 部分相似度计算结果需要手工进行调整。【结论】该方法考虑了词语间语义关系, 充分挖掘文本主体潜在信息, 并且改善了聚类质量, 为文本聚类和推荐提供了一条新途径。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量318下载量248 评论 0

2. chinaXiv:201711.02012 [pdf]

蒙古文音乐领域的语义检索初探

鲍玉来; 毕强
分类: 图书馆学、情报学 >> 情报学

【目的】在蒙古文信息资源急剧增长的背景下, 探索将基于本体的语义检索应用到蒙古文领域, 提高蒙古文信息资源检索效果。【方法】利用本体技术重视推理、互联的优势, 借助语义解析与推理工具Jena 的规则推理引擎, 设计并实现了基于蒙古文音乐领域本体的蒙古文语义检索系统。【结果】相较于关键词匹配检索, 语义检索系统查全率达到95.6%、查准率达到3.2%, 明显高于关键词匹配检索。【局限】仅以蒙古族多声部音乐为研究对象, 实验对象数据有限, 检索具有一定的局限性。【结论】对基于蒙古文领域本体的语义检索进行了完整的研究, 为蒙古文语义网应用研究打下良好的理论和技术基础。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量168下载量118 评论 0

3. chinaXiv:201711.02039 [pdf]

数字文献资源内容服务推荐研究——基于本体规则推理和语义相似度计算

刘健; 毕强; 刘庆旭; 王福
分类: 图书馆学、情报学 >> 情报学

【目的】解决传统数字文献资源内容服务推荐中无法充分挖掘资源语义信息等问题。【方法】通过设定本体推理规则对用户查询关键词进行语义扩展,提出一种新的语义相似度计算方法计算文献资源内容相似度。按照相似度大小对搜索结果进行排序,将排名较高的文献推荐给目标用户。【结果】实验结果证明,该方法能够较准确地计算语义相似度,并能够对用户需求进行有效推荐。【局限】缺少对数字资源的大规模采集,实验案例较少。【结论】该方法充分挖掘数字文献资源的语义信息并进行有效推荐,为数字资源内容服务推荐提供一种新思路。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量223下载量164 评论 0

4. chinaXiv:201711.01235 [pdf]

关联数据在学术资源网相似文献发现中的应用研究

赵夷平; 毕强
分类: 图书馆学、情报学 >> 情报学

【目的】利用关联数据的机器可读、语义表示、关联描述和网络资源属性的优势, 弥补学术资源网信息组织的不足, 为相似文献发现提供支持。【方法】采用潜在语义分析方法计算学术资源网发布的文献的总体相似度,通过层次聚类方法确定相似度阈值进行相似度筛选, 生成文档关系矩阵, 在此基础上利用动态文档技术构造学术资源网关联数据以支持关联文献语义检索。【结果】初步实现具有相似文献查询功能的学术资源网关联数据,用于便捷地获得与任何一篇文献高度相关的文献, 有助于高效地发现相似文献。【局限】仅从统计学角度实现学术资源网中相似文献的发现, 对于利用文档集知识体系、语义内涵和组织方式等进行深度的相似文献发现有待进一步研究。【结论】潜在语义分析方法计算文献相似度可有效发现相似文档, 将相似文献关联记录在关联数据中, 支持语义检索获得精确的相似文献, 并能够大幅缩减实时相似性计算的延迟。

提交时间: 2017-10-11 来自合作期刊:《数据分析与知识发现》 点击量178下载量116 评论 0

5. chinaXiv:201711.01212 [pdf]

数字图书馆微服务评价指标体系构建及实证研究

刘健; 毕强; 马卓
分类: 图书馆学、情报学 >> 情报学

【目的】基于人-信息-技术互动的视角构建数字图书馆微服务评价指标体系, 旨在为数字图书馆微服务建设提供理论依据和评判标准。【方法】提出基于聚类方法的群组AHP 方法, 利用其构造判断矩阵, 对数字图书馆微服务指标体系进行测评, 并选用模糊数学中隶属度函数作为标度系统对国内外10个具有代表性的数字图书馆进行实证研究。【结果】实证结果表明, 指标体系具有实际应用价值和较强的可操作性, 能更好地指导数字图书馆进行微服务建设。【局限】评价指标、评价标准、指标权重等还需根据各数字图书馆微服务的具体情况、具体问题进一步深入分析。实证研究的样本量较少, 结论具有局限性, 指标的确定和分值的给定(采用少数专家打分方式)带有主观性。【结论】在理论层面, 基于人-信息-技术互动视角构建的评价指标体系, 为数字图书馆微服务建设提供新的研究视角; 在实践应用层面, 通过对微服务的评价提升数字图书馆微服务质量和效率, 从而达到满足用户需求和期望的目标。

提交时间: 2017-10-11 来自合作期刊:《数据分析与知识发现》 点击量322下载量249 评论 0

  [1 页/ 5 条记录]