分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]关系质量是用来衡量用户与图书馆关系强度的指标。本研究试图构建科学的评价指标体系,对图书馆关系质量进行评价研究,进而有针对性地提出提高图书馆关系质量的管理建议。[方法/过程]针对高校图书馆用户进行问卷调研,利用探索性因子分析,总结图书馆关系质量的构成维度;并对用户感知的关系质量进行描述性统计分析、象限分析和方差分析。[结果/结论]实证研究结果显示,图书馆关系质量是由满意、信任和承诺3个维度组成的,用户对其评价总体上偏向于正面。其中,承诺维度评价最高,信任维度评价最低。对图书馆熟悉和非常熟悉的用户对图书馆关系质量的评价显著高于一般熟悉和不熟悉的用户。为了提高用户对关系质量的感知,图书馆应该建立推行图书馆服务的规范准则,提高图书馆员的服务能力,推动资源导向服务向用户导向服务的转变,加强图书馆与用户的互动。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]核心专利的发现是技术创新的重要环节,对于技术改进和专利战略布局意义重大。[方法/过程]首先界定核心专利的概念,然后在对原始PageRank算法模型介绍的基础上,结合专利的被引次数和专利的年龄对原始的PageRank算法进行改进,提出PatentRank算法(简称PTR),并将其应用到OLED领域中来识别核心专利。[结果/结论]研究发现,相比被引次数,PTR不仅能将该领域的核心专利识别出来,而且还可以识别出一些重要性的基础性专利,为研究OLED相关技术提供追本溯源的研究思路;相比原始PageRank算法,PTR具有更高的值区分度,在局部改善了PR的排名。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义]构建知乎信息传播过程PROV数据起源模型和用户可信度评价指标,量化知乎信息的可信度,丰富和完善社会化问答社区平台信息可信度评估的方法。[方法/过程]以知乎为研究对象,从信息传播过程的角度出发引入数据起源概念评估信息的可信度,通过建立知乎的PROV数据起源模型,追溯并记录知乎信息的来源和传播过程,与信息传播过程中涉及到的用户可信度分值相结合,计算出知乎信息的可信度定量结果。[结果/结论]通过对知乎信息可信度的评估,进一步完善信息可信度评估方法,为优化社区信息质量提供新思路。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】调研 owl:sameAs 连接在真实数据网络中的配置和应用情况。【方法】从 BTC 2014 数据集中抽取 部分数据, 应用统计学方法对样本数据构成的 sameAs 网络进行结构分析、域名分析和实例类型分析。【结果】 数据分析结果表明, 真实数据网络中 sameAs 连接较稀疏, 等同实体网络中大多数实体只建立了单个连接。【局限】 样本数据数量有限, 未能更全面地深入分析。【结论】该研究分析可以为关联数据中基于实例水平的数据集成、 本体对齐、知识发现以及跨数据集查询等提供参考。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》
摘要: 【目的】调研 owl:sameAs 连接在真实数据网络中的配置和应用情况。【方法】从 BTC 2014 数据集中抽取 部分数据, 应用统计学方法对样本数据构成的 sameAs 网络进行结构分析、域名分析和实例类型分析。【结果】 数据分析结果表明, 真实数据网络中 sameAs 连接较稀疏, 等同实体网络中大多数实体只建立了单个连接。【局限】 样本数据数量有限, 未能更全面地深入分析。【结论】该研究分析可以为关联数据中基于实例水平的数据集成、 本体对齐、知识发现以及跨数据集查询等提供参考。