Current Location:home > Browse

1. chinaXiv:201712.01383 [pdf]

基于日志分析的民办高校大学生网络生活 类型研究

陈润文; 邱 勇; 黄文彬; 王 军
Subjects: Library Science,Information Science >> Information Science

【目的】研究基于民办高校大学生的导航页面使用情况, 揭示民办高校大学生典型的网络生活类型及特点。 【方法】通过对导航页面设置数据采集点, 获得民办高校大学生的点击行为和搜索行为数据, 进行统一建模和特 征提取后, 利用聚类算法将其细分为几个有代表性的群体。【结果】将民办高校大学生划分为 6 个典型群体, 分 别为重度视频型、昼学夜玩型、搜索追剧型、沉迷直播型、劳逸结合型、勤奋学习型; 民办高校大学生主要用 网络看视频与直播, 仅有小部分学生利用互联网进行学习。【局限】PC 端导航页面行为仅能反映大学生网络生 活的一部分, 且数据的时间跨度为两个月, 不能反映学生在期初和期末的行为差异。【结论】本研究实现了民办 高校大学生群体中典型网络生活类型的识别, 这将有助于民办高校大学生特点和行为规律的发现和总结, 为提 升高校服务管理水平提供参考建议。

submitted time 2017-12-05 From cooperative journals:《数据分析与知识发现》 Hits289Downloads168 Comment 0

2. chinaXiv:201712.01601 [pdf]

基于日志分析的民办高校大学生网络生活 类型研究

陈润文; 邱 勇; 黄文彬; 王 军
Subjects: Library Science,Information Science >> Information Science

【目的】研究基于民办高校大学生的导航页面使用情况, 揭示民办高校大学生典型的网络生活类型及特点。 【方法】通过对导航页面设置数据采集点, 获得民办高校大学生的点击行为和搜索行为数据, 进行统一建模和特 征提取后, 利用聚类算法将其细分为几个有代表性的群体。【结果】将民办高校大学生划分为 6 个典型群体, 分 别为重度视频型、昼学夜玩型、搜索追剧型、沉迷直播型、劳逸结合型、勤奋学习型; 民办高校大学生主要用 网络看视频与直播, 仅有小部分学生利用互联网进行学习。【局限】PC 端导航页面行为仅能反映大学生网络生 活的一部分, 且数据的时间跨度为两个月, 不能反映学生在期初和期末的行为差异。【结论】本研究实现了民办 高校大学生群体中典型网络生活类型的识别, 这将有助于民办高校大学生特点和行为规律的发现和总结, 为提 升高校服务管理水平提供参考建议。

submitted time 2017-11-30 From cooperative journals:《数据分析与知识发现》 Hits321Downloads228 Comment 0

3. chinaXiv:201711.01939 [pdf]

一种基于滑动窗口模型的MOOCs辍学率预测方法

卢晓航; 王胜清; 黄俊杰; 陈文广; 闫增旺
Subjects: Library Science,Information Science >> Information Science

【目的】通过北京大学在Coursera 平台上运行的课程数据, 对学生的辍学行为进行研究, 以期预测学生的辍学点和辍学行为, 改建教学慕课质量和方法。【方法】在课程数据基础上, 提取19个特征, 使用机器学习算法构建滑动窗口模型, 动态预测学习者辍学率。【结果】模型预测准确率高, 普遍在90%以上, 效果稳定, 支持向量机(SVM)和长短记忆网络(LSTM)方法建模效果更好。【局限】课程数据选课人数偏多, 没有考虑其他课程数据稀疏问题, 模型的可移植性仍需要进一步考虑。【结论】使用滑动窗口模型建模, 能够帮助MOOC课程教师和设计者动态地追踪课程学习者辍学行为, 准确率高, 可以帮助教师通过快速的反馈来调整课程, 降低辍学率。

submitted time 2017-11-08 From cooperative journals:《数据分析与知识发现》 Hits596Downloads358 Comment 0

4. chinaXiv:201711.01214 [pdf]

自动引文摘要研究述评

刘天祎; 步一; 赵丹群; 黄文彬
Subjects: Library Science,Information Science >> Information Science

【目的】对引文摘要领域的国外主流研究方法和步骤进行综述分析。【文献范围】选取2007 年以来引文摘要领域的重要研究及此前自动摘要、引文分析领域的研究进展。【方法】基于文献调研, 介绍该领域的基本概念以及自然语言处理的方法在引文摘要中的应用。【结果】引文句在摘要实践中起到重要的概括作用、指示作用和关联作用, 具有一定的优越性。【局限】缺乏对引文摘要领域现有成果和可能达成的理想情况的比较。【结论】引文摘要拓展了自动摘要和传统的信息计量学的研究方向, 并对改进自动摘要原有的评估方案提出要求, 同时产生了有关引文窗口扩展、语料库构建等一系列新问题。本文对这些问题进行探讨, 并对引文摘要未来的研究发展进行展望。

submitted time 2017-10-11 From cooperative journals:《数据分析与知识发现》 Hits184Downloads139 Comment 0

5. chinaXiv:201711.01227 [pdf]

多会话商品信息搜寻行为、情境及影响因素研究

刘洪莲; 张鹏翼; 王 军
Subjects: Library Science,Information Science >> Information Science

【目的】研究电商用户在多会话网购过程中的商品信息搜寻的行为特征、会话时间间隔特征以及购物网站使用特征, 并探究行为背后的情境、原因和动力。【方法】基于某电商网站4 285 个用户的1 409 160 条访问日志, 利用顺序分析和聚类分析方法挖掘用户信息搜寻行为特征, 结合访谈研究行为背后的情境、原因等影响因素。【结果】多会话网购用户信息需求并不急切, 较之搜索更倾向于查看商品详情; 平均会话时间间隔为3-4 天;继续原来购物任务的动力包括个人偏好、需求状态、支付能力、时间等方面的因素; 用户主要通过搜索、购物车、收藏夹、同店或同款商品浏览、商品个性化推荐等途径回到原来购物任务。【局限】访谈结果受样本数量限制, 不具有普适性。【结论】有助于理解用户的复杂网购行为, 指导购物网站提高服务质量, 改善用户体验。

submitted time 2017-10-11 From cooperative journals:《数据分析与知识发现》 Hits245Downloads169 Comment 0

6. chinaXiv:201711.01240 [pdf]

商品检索中的多任务识别与分析

张鹏翼; 周翔; 王军
Subjects: Library Science,Information Science >> Information Science

【目的】对商品检索中的购物任务进行识别, 并对多任务会话行为特征进行分析。【方法】利用淘宝商品分类体系以及自建的商品词表, 根据商品检索的检索式进行购物任务识别, 数据集为2 754 个用户的19 704 个检索会话。【结果】影响每个购物任务所用检索式数的因素包括商品分面、数量的多少以及描述难易程度;有主要任务和次要任务之分的多任务会话中, 任务之间的关系更为紧密。【局限】购物任务识别方法有待完善, 只以检索式作为研究对象无法全面反映用户行为特征。【结论】本研究可以帮助理解购物中的商品检索行为, 并为设计更好的商品推荐算法、预测用户购物过程、行为等提供依据。

submitted time 2017-10-11 From cooperative journals:《数据分析与知识发现》 Hits391Downloads317 Comment 0

  [1 Pages/ 6 Totals]