您当前的位置:首页 > 论文浏览

1. chinaXiv:201712.01385 [pdf]

基于用户偏好与商品属性情感匹配的图书 个性化推荐研究*

侯银秀; 李伟卿; 王伟军; 张婷婷
分类: 图书馆学、情报学 >> 情报学

【目的】识别并获取细粒度的用户偏好信息, 优化图书个性化推荐的效果。【方法】使用情感分析方法对 用户图书评论进行属性层文本挖掘, 通过用户本身的图书评论获取用户对图书属性的偏好; 基于每本图书的所 有评论的情感计算获得其属性评分; 将用户偏好矩阵、图书属性得分矩阵进行匹配, 从而实现用户对图书属性情 感偏好的个性化推荐。【结果】利用亚马逊图书评论数据作为数据来源分别对传统的协同过滤方法与本文提出的 推荐方法进行实验对比。结果表明, 本文提出的方法在准确性、召回率、覆盖率上分别提高了 0.030、0.097、0.2812。 【局限】未考虑时间因素对用户偏好的影响, 并且属性类型的全面程度受亚马逊图书评论数量和质量的限制。 【结论】本文计算用户对图书属性的情感得分, 得到细粒度的用户偏好信息, 并通过与图书属性的得分进行匹配, 提升了图书个性化推荐的效果。

提交时间: 2017-12-05 来自合作期刊:《数据分析与知识发现》 点击量345下载量267 评论 0

2. chinaXiv:201712.01403 [pdf]

基于标签与关系网络的用户聚类推荐研究*

熊回香; 蒋武轩
分类: 图书馆学、情报学 >> 情报学

【目的】利用用户标签及关系网络, 为用户推荐潜在的相似用户。【方法】通过探究社会化标注系统中标 签、关系网络所表征的用户长短期兴趣特征, 综合用户标签及关注关系, 利用多维尺度法构建用户聚类模型, 根 据用户聚类结果进行相似用户推荐, 并以“微博”为例对模型进行实证。【结果】实验结果表明, 基于标签和关系 网络的用户聚类模型能够有效地结合用户长短期兴趣特征, 挖掘潜在相似用户, 聚类及推荐效果较好。【局限】 样本数据集具有局限性, 不能完全涵盖用户兴趣领域, 仅从一个领域验证了模型的准确性与有效性。【结论】通 过对用户标签及关系网络挖掘用户长短期兴趣, 构建的基于用户静态标签与动态关系网络的用户推荐模型, 对 个性化用户推荐效果有较好的提升。

提交时间: 2017-12-05 来自合作期刊:《数据分析与知识发现》 点击量112下载量85 评论 0

3. chinaXiv:201712.01602 [pdf]

基于用户偏好与商品属性情感匹配的图书 个性化推荐研究*

侯银秀; 李伟卿; 王伟军; 张婷婷
分类: 图书馆学、情报学 >> 情报学

【目的】识别并获取细粒度的用户偏好信息, 优化图书个性化推荐的效果。【方法】使用情感分析方法对 用户图书评论进行属性层文本挖掘, 通过用户本身的图书评论获取用户对图书属性的偏好; 基于每本图书的所 有评论的情感计算获得其属性评分; 将用户偏好矩阵、图书属性得分矩阵进行匹配, 从而实现用户对图书属性情 感偏好的个性化推荐。【结果】利用亚马逊图书评论数据作为数据来源分别对传统的协同过滤方法与本文提出的 推荐方法进行实验对比。结果表明, 本文提出的方法在准确性、召回率、覆盖率上分别提高了 0.030、0.097、0.2812。 【局限】未考虑时间因素对用户偏好的影响, 并且属性类型的全面程度受亚马逊图书评论数量和质量的限制。 【结论】本文计算用户对图书属性的情感得分, 得到细粒度的用户偏好信息, 并通过与图书属性的得分进行匹配, 提升了图书个性化推荐的效果。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量275下载量190 评论 0

4. chinaXiv:201712.01613 [pdf]

基于标签与关系网络的用户聚类推荐研究*

熊回香; 蒋武轩
分类: 图书馆学、情报学 >> 情报学

【目的】利用用户标签及关系网络, 为用户推荐潜在的相似用户。【方法】通过探究社会化标注系统中标 签、关系网络所表征的用户长短期兴趣特征, 综合用户标签及关注关系, 利用多维尺度法构建用户聚类模型, 根 据用户聚类结果进行相似用户推荐, 并以“微博”为例对模型进行实证。【结果】实验结果表明, 基于标签和关系 网络的用户聚类模型能够有效地结合用户长短期兴趣特征, 挖掘潜在相似用户, 聚类及推荐效果较好。【局限】 样本数据集具有局限性, 不能完全涵盖用户兴趣领域, 仅从一个领域验证了模型的准确性与有效性。【结论】通 过对用户标签及关系网络挖掘用户长短期兴趣, 构建的基于用户静态标签与动态关系网络的用户推荐模型, 对 个性化用户推荐效果有较好的提升。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量118下载量90 评论 0

5. chinaXiv:201711.01927 [pdf]

基于情境感知技术的移动数据自动采集系统设计与实现

夏立新; 杨金庆; 程秀峰
分类: 图书馆学、情报学 >> 情报学

【目的】为移动环境下数据采集与分析提供一种基于情境感知技术(Context Awareness)的设计框架, 以优化移动数据自动化采集过程。【应用背景】尽管基于移动端的情景感知数据采集较之传统网络环境下的人工与半自动方式有所发展, 但利用移动端底层传感器直接获取实时用户信息, 实现实时、动态、全面的数据采集与挖掘进而达到主动提供服务的目的, 这方面的应用仍处于发展阶段。【方法】利用Android 自带的众多传感器, 设计了客户端自动采集、服务器主动接收的数据采集框架。在实证与评价方面, 设计了一个通过动态情境感知推荐高层服务的实例。【结果】实证结果表明: 该系统能够针对某一情境采集移动用户数据, 为高层推荐服务提供良好支持。【局限】采集到的数据具有较大的冗余度, 未进行多角度、全面、深度的情境推理, 需要在以后的研究中针对用户数据进行深入分析。【结论】基于情境感知的移动数据自动采集系统能够进行移动数据的主动采集, 并依据采集结果对个体或群体进行推送服务, 对移动环境下用户行为研究与情境计算研究都起到较好的支撑作用。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量536下载量299 评论 0

6. chinaXiv:201711.01969 [pdf]

专家检索与专家排名研究评述

叶光辉; 夏立新
分类: 图书馆学、情报学 >> 情报学

【目的】对已有专家检索与专家排名方法进行评述, 为后续研究提供理论基础。【文献范围】从Web of Science (WOS)、CNKI 等数据库中分别以“专家检索(Expert Retrieval)”、“专家排名(Expert Ranking)”、“排名融合(Ranking Fusion)”等为检索词搜集获得相关文献65 篇。【方法】针对专家检索覆盖面不足及专家特征计算量大两方面问题, 从专家检索评测和排名融合两个角度梳理并评析现有的研究进展。【结果】融合关系属性是目前专家检索方法的主流, 检索结果可信度研究主要依据用户满意度和文档可信度开展; 专家排名采用友邻推荐模型、PageRank、D-S 理论、社交网络与复杂网络分析等实现排名及排名融合, 融合结果总体优于基准排名。【局限】不同排名融合方法间的横向对比研究较少。【结论】相关研究可为构建信息融合视角下的专家会诊平台提供参考,具体体现在专家信息组织、专家遴选和专家意见融合环节。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量1359下载量134 评论 0

7. chinaXiv:201711.02130 [pdf]

专家检索与专家排名研究评述

叶光辉; 夏立新
分类: 图书馆学、情报学 >> 情报学

【目的】对已有专家检索与专家排名方法进行评述, 为后续研究提供理论基础。【文献范围】从Web of Science (WOS)、CNKI 等数据库中分别以“专家检索(Expert Retrieval)”、“专家排名(Expert Ranking)”、“排名融合(Ranking Fusion)”等为检索词搜集获得相关文献65 篇。【方法】针对专家检索覆盖面不足及专家特征计算量大两方面问题, 从专家检索评测和排名融合两个角度梳理并评析现有的研究进展。【结果】融合关系属性是目前专家检索方法的主流, 检索结果可信度研究主要依据用户满意度和文档可信度开展; 专家排名采用友邻推荐模型、PageRank、D-S 理论、社交网络与复杂网络分析等实现排名及排名融合, 融合结果总体优于基准排名。【局限】不同排名融合方法间的横向对比研究较少。【结论】相关研究可为构建信息融合视角下的专家会诊平台提供参考,具体体现在专家信息组织、专家遴选和专家意见融合环节。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量1092下载量121 评论 0

8. chinaXiv:201711.01242 [pdf]

基于地理坐标的微博事件检测与分析

李进华; 安仲杰
分类: 图书馆学、情报学 >> 情报学

【目的】利用数据挖掘算法, 从海量繁杂的微博数据中检测出有价值的事件信息。【方法】针对国内具有代表性的微博网站, 通过使用微博网络开放接口高效收集带有地理坐标的微博数据。使用K-means、KNN 和决策树三种数据挖掘算法, 根据微博数据的发布数、转发数、评论数、用户活跃度和移动强度5 个指标构建微博的地理规律性特征。将日常地区性的微博数据特征与该地区微博特征的地理规律性进行比较, 从而检测出该区域是否有事件发生。【结果】以2015 年4 月15 日、16 日的微博数据作为测试语料, 使用文中提出的微博事件检测框架, 成功检测到“北京沙尘暴”事件。【局限】在抽取微博地理规律性特征时, 采用的样本数据偏少, 一定程度上影响了事件检测框架的效果。【结论】基于地理坐标的微博事件检测框架是切实有效的, 分析出的事件信息不仅可以帮助用户获取感兴趣的事件资讯, 而且可以协助政府部门进行舆情管控和行政决策。

提交时间: 2017-10-11 来自合作期刊:《数据分析与知识发现》 点击量141下载量103 评论 0

9. chinaXiv:201711.01258 [pdf]

LOD 的网络结构分析与可视化

夏立新; 谭荧
分类: 图书馆学、情报学 >> 情报学

【目的】对关联开放数据(LOD)进行结构特征分析, 利用分析结果指导关联数据的组织实践。【方法】通过度分布、平均路径长度、聚类系数等指标描述LOD 网络结构, 对比复杂网络理论中的两个基本性质: 无标度特性和小世界效应。【结果】LOD 整体网络结构具有近似无标度网络的幂率分布特征, 图书馆学、情报学领域子网具有相对均匀的指数分布特征, 两网同时具有短平均路径长度和高聚类系数的小世界效应。【局限】缺乏对关键节点的多权重赋值。【结论】LOD 的小世界特性能优化检索效率, 而无标度特性会降低整个网络的稳定性。

提交时间: 2017-10-11 来自合作期刊:《数据分析与知识发现》 点击量209下载量159 评论 0

  [1 页/ 9 条记录]