您当前的位置:首页 > 论文浏览

按提交时间

按机构

您选择的条件: 2017-11-30(48)

1. chinaXiv:201712.01592 [pdf]

基于 CSpace 的科技信息可配置化自动监测 功能设计与实现*

王思丽; 刘 巍; 祝忠明; 吴志强; 王金平
分类: 图书馆学、情报学 >> 情报学

【目的】实现对多源异构科技信息的长期监测、自动采集发布与存储管理, 以满足专题领域科技研究的需 求。【方法】结合 CSpace 的应用扩展需求, 设计开发了基于 CSpace 的可配置化的科技信息自动监测功能, 着重 研究和解决了多源异构科技信息采集内容规则的可配置化实现、与 CSpace 交互的自动采集发布接口的可配置化 实现等关键技术问题, 并以海洋科技信息的自动监测采集为例进行应用研究。【结果】能够实现对多源异构科技 信息的自动监测采集, 为科技平台建设提供良好支持。【局限】采集内容规则配置过程比较复杂; 不支持对一些 需要登录的复杂站点的自动监测。【结论】该功能方法较大程度上扩展了 CSpace 的数据采集集成功能, 且具有 一定的通用性、可配置性与松耦合性, 可应用于多个科技信息监测领域。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量199下载量129 评论 0

2. chinaXiv:201712.01593 [pdf]

关联数据中 owl:sameAs 网络分析*

贾君枝; 李 晓
分类: 图书馆学、情报学 >> 情报学

【目的】调研 owl:sameAs 连接在真实数据网络中的配置和应用情况。【方法】从 BTC 2014 数据集中抽取 部分数据, 应用统计学方法对样本数据构成的 sameAs 网络进行结构分析、域名分析和实例类型分析。【结果】 数据分析结果表明, 真实数据网络中 sameAs 连接较稀疏, 等同实体网络中大多数实体只建立了单个连接。【局限】 样本数据数量有限, 未能更全面地深入分析。【结论】该研究分析可以为关联数据中基于实例水平的数据集成、 本体对齐、知识发现以及跨数据集查询等提供参考。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量68下载量51 评论 0

3. chinaXiv:201712.01594 [pdf]

CSpace 机构知识库影音资源支持能力扩展 研究与实践*

吴志强; 祝忠明; 姚晓娜; 王思丽
分类: 图书馆学、情报学 >> 情报学

【目的】提出机构知识库影音支持能力扩展方向, 实现 CSpace 机构知识库影音支持能力扩展。【应用背景】 影音知识资源在机构产出中所占比例不断增长, 扩展机构知识库影音支持能力可更好地揭示、发现影音知识资 源, 挖掘和利用其学术研究价值和潜力。【方法】分析用户的应用需求和国内外机构知识库影音支持服务的发展 趋势, 构建机构知识库影音资源支持功能扩展框架, 选择其中的关键技术和方法搭建实验平台, 探索将其应用 于 CSpace 系统的可行性。【结果】实现了影音格式转换、视频场景分析和具有场景导航功能的播放器。【结论】 影音转码稳定性和效率较高, 其他影音支持功能离实用还存在一定距离, 将影音格式转换技术应用于 CSpace 机 构知识库系统中, 能够扩展机构知识库的影音支持服务。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量165下载量114 评论 0

4. chinaXiv:201712.01595 [pdf]

基于标签的商品推荐模型研究*

涂海丽; 唐晓波
分类: 图书馆学、情报学 >> 情报学

【目的】构建社会化电子商务环境下基于标签的个性化商品推荐模型。【方法】综合考虑用户使用标签的 频率和时间因素计算用户的兴趣偏好; 基于标签层次特征和电子商务网站中关于商品特征的检索条件, 构建某 一主题商务社区中商品本体; 利用本体规范化用户标签语义, 并对商品进行分类; 寻找含有用户偏好的类簇, 计 算该类簇中商品与用户偏好商品的相似度, 将用户未标注过的商品与用户偏好相似度高的商品推荐给用户。 【结果】从翻东西网站上随机选取 200 个活跃用户关于热门商品的标注信息进行分析, 验证该模型的有效性。【局 限】在计算用户兴趣偏好时, 只考虑用户使用标签的频率和时间因素, 未考虑其他因素。【结论】该模型相对于 利用标签进行协同过滤推荐方法具有较优的效果, 计算时间和空间复杂度更小。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量108下载量77 评论 0

5. chinaXiv:201712.01596 [pdf]

开放数据平台的接口服务研究及应用探讨*

翁丹玉; 翟 军; 袁长峰; 林 岩
分类: 图书馆学、情报学 >> 情报学

【目的】分析我国地方政府各开放数据平台接口服务同国际发展趋势的差距, 探讨提升互操作性的途径。 【应用背景】“十三五”期间, 我国将建设国家政府数据统一开放平台, 推动各级政府数据的开放共享与深度利用, 对开放数据接口服务有着广泛的需求。【方法】在介绍国际上主要的开放数据平台和 W3C API 最佳实践基础上, 分析我国开放数据平台接口服务的主要不足。引进开放数据协议 OData, 给出开放标准化 API 服务的关键步骤。 【结果】通过搭建 OData 服务、发布说明文档和附加机器可读的元数据, 为遵循国际通用的最佳实践打下基础。 【结论】我国在提供接口服务时, 需要借鉴先进经验, 采纳国际标准是提升互操作水平的关键。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量68下载量39 评论 0

6. chinaXiv:201712.01597 [pdf]

基于多特征多分类器集成的专利自动分类 研究*

贾杉杉; 刘 畅; 孙连英; 刘小安; 彭 涛
分类: 图书馆学、情报学 >> 情报学

【目的】为了准确地给专利申请书分配 IPC 分类号, 本文提出一种基于多特征多分类器集成的专利自动分 类方法。【方法】使用从专利申请书中提取的全词典 TFIDF 特征、信息增益词典 TFIDF 特征、段落向量特征、 主题模型向量特征, 分别训练朴素贝叶斯、支持向量机、AdaBoost 分类器, 以此构建特征–类别矩阵, 并结合 F1 权重矩阵集成, 获得最终 IPC 预测分类号。【结果】对 2014 年–2016 年“发动机或泵”领域的 10 个小类进行分 类, 使用 Top Prediction、All Categories 和 Two Guesses 三种评估方法得到准确率分别为: 78.9%、80.1%、91.2%。 【局限】训练仅仅使用了 2014 年–2016 年共三年的专利数据, 数据规模有限。【结论】在“发动机或泵”领域, 本文 方法能够有效地提高专利文本分类的准确率。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量68下载量49 评论 0

7. chinaXiv:201712.01598 [pdf]

社会网络中关键节点的识别 ——基于符号网络的 PageRank 算法改进

陈晓威; 史昱天
分类: 图书馆学、情报学 >> 情报学

【目的】针对 PageRank 算法在符号网络中的局限性, 提出其改进算法, 以识别社会网络中的关键节点。 【方法】基于符号网络的相关理论, 将 PageRank 算法与点度中心性相结合, 提出 KeyRank 算法, 并对 Slashdot 网站的用户数据进行分析, 以获取用户的 KeyRank 算法排名。【结果】PageRank 算法排名、入度排名、M-PR 算 法排名与 KeyRank 算法排名在统计学意义上呈中度正相关。【局限】KeyRank 算法忽略了每次迭代时正、负链 接的相互作用。【结论】传统算法与 KeyRank 算法在节点排序上存在差异, 说明链接的符号属性对排序结果产生 了重要影响, 改进算法具有一定的理论和实践意义。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量140下载量98 评论 0

8. chinaXiv:201712.01599 [pdf]

基于网络用户评论的评分预测模型研究*

张红丽; 刘济郢; 杨斯楠; 徐 健
分类: 图书馆学、情报学 >> 情报学

【目的】通过网络用户评论, 为评论网站构建有效的评分预测机制。【方法】提出基于网络用户评论的评 分预测模型, 该模型包括 4 个模块: 网络用户评论获取模块、预测变量获取模块、预测分析模块以及预测结果评 价模块。抓取 30 部不同类型的电影评论数据, 27 部用于构建模型, 3 部用于检验模型。【结果】使用逐步回归方 法筛选出变量: 参与评分人数、参与评论人数、想要观看人数和电影正向评论情感均值, 构建评分预测模型。使 用 3 部电影验证, 预测评分与 IMDb 评分相差最大值为 0.0644, 最小值为 0.0227。【局限】在数据样本量、情感 特征提取精度、模型普适性验证等方面有待进一步提升。【结论】该模型能够依据用户评论对评分进行有效预测, 在网络水军探测方面也能发挥一定的作用。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量76下载量60 评论 0

9. chinaXiv:201712.01600 [pdf]

基于多特征融合的金融领域科研合作推荐 研究*

余传明; 龚雨田; 赵晓莉; 安 璐
分类: 图书馆学、情报学 >> 情报学

【目的】科研合作关系是一种重要的社会网络。为了促进科研合作, 提高科研生产率, 对金融领域的科研 合作推荐模型进行研究。【方法】建立金融领域个人、机构和区域三个层面的科研合作网络, 提出一种新的融合 基于邻居节点和基于路径的网络特征的科研合作推荐模型, 并从个人、机构和区域三个层面进行实证检验。【结 果】通过对 2000 年到 2014 年刊载的 68 905 篇金融领域的文章进行分析并构建科研合作网络, 在个人、机构和 区域三个层面上, 基于特征融合的链接预测方法的 AUC 值分别为 84.25%、87.34%和 91.84%, 均高于基于邻居 节点的算法和基于路径的算法的 AUC 值。【局限】在进行训练集和测试集选取的时候只按时间进行切分, 有待 使用更多的切分方式对实验结果进行优化。【结论】本文有助于金融科研领域的个人、机构和区域寻求合作对象, 为进行科研网络的研究以及科研合作推荐的学者提供新的研究方法和思路。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量121下载量84 评论 0

10. chinaXiv:201712.01601 [pdf]

基于日志分析的民办高校大学生网络生活 类型研究

陈润文; 邱 勇; 黄文彬; 王 军
分类: 图书馆学、情报学 >> 情报学

【目的】研究基于民办高校大学生的导航页面使用情况, 揭示民办高校大学生典型的网络生活类型及特点。 【方法】通过对导航页面设置数据采集点, 获得民办高校大学生的点击行为和搜索行为数据, 进行统一建模和特 征提取后, 利用聚类算法将其细分为几个有代表性的群体。【结果】将民办高校大学生划分为 6 个典型群体, 分 别为重度视频型、昼学夜玩型、搜索追剧型、沉迷直播型、劳逸结合型、勤奋学习型; 民办高校大学生主要用 网络看视频与直播, 仅有小部分学生利用互联网进行学习。【局限】PC 端导航页面行为仅能反映大学生网络生 活的一部分, 且数据的时间跨度为两个月, 不能反映学生在期初和期末的行为差异。【结论】本研究实现了民办 高校大学生群体中典型网络生活类型的识别, 这将有助于民办高校大学生特点和行为规律的发现和总结, 为提 升高校服务管理水平提供参考建议。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量86下载量72 评论 0

12345  尾页  转到  [5 页/ 48 条记录]