您当前的位置:首页 > 论文浏览

1. chinaXiv:201712.01371 [pdf]

基于链接分析法对国内网络直播平台综合 影响力的评价研究*

史昱天; 朱庆华; 赵宇翔(2): 陈晓威
分类: 图书馆学、情报学 >> 情报学

【目的】探究如何利用链接分析法科学合理地对网络直播平台综合影响力做出客观评价。【方法】借助 Google 和 Alexa 工具收集国内 20 家知名网络直播平台的相关链接数据, 使用改进指标权重计算方法的灰色关联 分析法, 对这 20 家网站的综合影响力进行评价。【结果】获得网络直播平台影响力的综合排名, 并依据此分析国 内网络直播平台特征及现状。【局限】能获取全面数据的网络直播平台数量较少, 故选取样本数量有限。【结论】 中国当前网络直播平台的整体水平还不高, 本文从链接角度出发, 提出进一步提升平台影响力的方法策略

提交时间: 2017-12-05 来自合作期刊:《数据分析与知识发现》 点击量698下载量204 评论 0

2. chinaXiv:201712.01379 [pdf]

社会网络中关键节点的识别 ——基于符号网络的 PageRank 算法改进

陈晓威; 史昱天
分类: 图书馆学、情报学 >> 情报学

【目的】针对 PageRank 算法在符号网络中的局限性, 提出其改进算法, 以识别社会网络中的关键节点。 【方法】基于符号网络的相关理论, 将 PageRank 算法与点度中心性相结合, 提出 KeyRank 算法, 并对 Slashdot 网站的用户数据进行分析, 以获取用户的 KeyRank 算法排名。【结果】PageRank 算法排名、入度排名、M-PR 算 法排名与 KeyRank 算法排名在统计学意义上呈中度正相关。【局限】KeyRank 算法忽略了每次迭代时正、负链 接的相互作用。【结论】传统算法与 KeyRank 算法在节点排序上存在差异, 说明链接的符号属性对排序结果产生 了重要影响, 改进算法具有一定的理论和实践意义。

提交时间: 2017-12-05 来自合作期刊:《数据分析与知识发现》 点击量524下载量450 评论 0

3. chinaXiv:201712.01389 [pdf]

基于 LSTM 模型的中文图书多标签分类 研究*

邓三鸿; 傅余洋子; 王 昊
分类: 图书馆学、情报学 >> 情报学

【目的】利用 LSTM 模型和字嵌入的方法构建分类系统, 提出一种中文图书分类中多标签分类的解决方 案。【方法】引入深度学习算法, 利用字嵌入方法和 LSTM 模型构建分类系统, 对题名、主题词等字段组成的字 符串进行学习以训练模型, 并采用构建多个二元分类器的方法解决多标签分类问题, 选择 3 所高校 5 个类别的书 目数据进行实验。【结果】从整体准确率、各类别精度、召回率、F1 值多个指标进行分析, 本文提出的模型均有 良好表现, 有较强的实际应用价值。【局限】数据仅涉及中图分类法 5 个类别, 考虑的分类粒度较粗等。【结论】 基于 LSTM 模型的中文图书分类系统具有预处理简单、增量学习、可迁移性高等优点, 具备可行性和实用性。

提交时间: 2017-12-05 来自合作期刊:《数据分析与知识发现》 点击量406下载量307 评论 0

4. chinaXiv:201712.01394 [pdf]

中国农产品品牌评价研究的内容解析*

王雪颖; 张紫玄; 王 昊; 邓三鸿
分类: 图书馆学、情报学 >> 情报学

【目的】通过分析中国农产品品牌评价领域的文献题名总结该领域的研究现状。【方法】对该领域的文献 题名进行 K-means 聚类, 分析每簇研究的重点内容, 分别使用因子分析、多维尺度分析和层次聚类分析进一步解 析聚类得到的每簇文献的特点。【结果】文献数量总体呈现“M”型趋势, 文献多采用模糊综合法, 从多个评价角 度集中探讨评价指标体系、评价模型、影响因素等方面。【局限】仅针对题名进行分析, 未涉及关键词与摘要文 本。【结论】聚类结果较好地揭示了中国该领域的研究现状, 但没有反映出种类农产品、Interband 品牌评估法相 关内容。

提交时间: 2017-12-05 来自合作期刊:《数据分析与知识发现》 点击量266下载量168 评论 0

5. chinaXiv:201712.01598 [pdf]

社会网络中关键节点的识别 ——基于符号网络的 PageRank 算法改进

陈晓威; 史昱天
分类: 图书馆学、情报学 >> 情报学

【目的】针对 PageRank 算法在符号网络中的局限性, 提出其改进算法, 以识别社会网络中的关键节点。 【方法】基于符号网络的相关理论, 将 PageRank 算法与点度中心性相结合, 提出 KeyRank 算法, 并对 Slashdot 网站的用户数据进行分析, 以获取用户的 KeyRank 算法排名。【结果】PageRank 算法排名、入度排名、M-PR 算 法排名与 KeyRank 算法排名在统计学意义上呈中度正相关。【局限】KeyRank 算法忽略了每次迭代时正、负链 接的相互作用。【结论】传统算法与 KeyRank 算法在节点排序上存在差异, 说明链接的符号属性对排序结果产生 了重要影响, 改进算法具有一定的理论和实践意义。

提交时间: 2017-11-30 来自合作期刊:《数据分析与知识发现》 点击量276下载量192 评论 0

6. chinaXiv:201711.01949 [pdf]

中文文本聚类常用停用词表对比研究

官琴; 邓三鸿; 王昊
分类: 图书馆学、情报学 >> 情报学

【目的】通过实验对比分析, 比较不同停用词表对于不同类型的文本数据的作用效果, 对停用词表的构建与使用提供参考意见。【方法】选取百度停用词表、哈尔滨工业大学停用词表以及四川大学机器智能实验室停用词表, 基于三个不同语料库运用汉语分词技术、TF-IDF 特征评估函数以及VSM 模型进行文本处理, 并且采用Java 编写的K-means 算法进行聚类实验, 通过准确率P、召回率R 和F1 三个评价指标对不同聚类结果进行效果评估。【结果】不同停用词表对于不同类型的文本数据作用效果差异明显, 词表的长度、内容结构是影响作用效果的直接因素, 其中两字停用词作用效果最为明显。【局限】实验文本类型及数量有限, 同时对于不同停用词表仅在词语数量及内容上做了简单的分析比较, 未对停用词按照类别分类进行实验分析。【结论】停用词表对于文本聚类准确度有很大的影响, 构建或选取适宜的中文停用词表极为重要。同时, 过度增加停用词的数量并不会一直改善聚类结果。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量550下载量407 评论 0

7. chinaXiv:201711.01975 [pdf]

引文元数据的自动发现和标注方法研究——以外文引文为例

姜霖; 王东波
分类: 图书馆学、情报学 >> 情报学

【目的】在总结当前引文元数据抽取方法的基础上, 结合语义学知识和机器学习方法, 对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量空间中某一位置的现象, 通过支持向量机分类算法实现对元数据的自动归类和标注。【结果】在以外文引文数据作为测试集的实验中, 本文方法取得了较高的准确率和召回率, 特别是针对引文中含有多种语言和缩写的现象, 具有较好的处理能力。【局限】在对于引文元数据时间内容的细粒度抽取中存在一定的局限性。【结论】实验结果表明, 此方法在引文元数据的自动发现和标注上具有良好的效果, 并能很大程度地提高方法的适用性和容错率。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量335下载量214 评论 0

8. chinaXiv:201711.01995 [pdf]

引文元数据的自动发现和标注方法研究——以外文引文为例

姜霖; 王东波
分类: 图书馆学、情报学 >> 情报学

【目的】在总结当前引文元数据抽取方法的基础上, 结合语义学知识和机器学习方法, 对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量空间中某一位置的现象, 通过支持向量机分类算法实现对元数据的自动归类和标注。【结果】在以外文引文数据作为测试集的实验中, 本文方法取得了较高的准确率和召回率, 特别是针对引文中含有多种语言和缩写的现象, 具有较好的处理能力。【局限】在对于引文元数据时间内容的细粒度抽取中存在一定的局限性。【结论】实验结果表明, 此方法在引文元数据的自动发现和标注上具有良好的效果, 并能很大程度地提高方法的适用性和容错率。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量348下载量234 评论 0

9. chinaXiv:201711.02030 [pdf]

基于参与者共现分析的博文聚类研究

龚凯乐; 成颖; 孙建军
分类: 图书馆学、情报学 >> 情报学

【目的】将博文参与者共现作为特征, 探析其在博文聚类中的价值。【方法】两步聚类: 构建不同博文参与者的共现矩阵并转化为相关矩阵, 采用近邻传播(Affinity Propagation, AP)算法完成第一步聚类;将AP 聚类结果的质心作为初始聚类中心, 对词项进行位置加权, 利用K-means 算法完成博文内容的第二步聚类。【结果】综合博文参与者共现与词项位置加权的聚类算法平均准确率与纯度分别达到0.66 和0.57, 显著优于对比实验。【局限】本研究的主要贡献是引入参与者共现作为特征改进博文聚类效果, 对于该特征甚少的博文聚类价值有限。【结论】整合词项与博文参与者特征的博文聚类显著地提高了聚类质量, 两步法聚类也为K-means 算法初始聚类中心的选择提供了可行的解决方案。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量221下载量158 评论 0

10. chinaXiv:201711.00174 [pdf]

知识视角下美国外交关系协会的智库功能探究

王铮
分类: 图书馆学、情报学 >> 情报学

[目的/意义] 通过考察美国外交关系协会的智库功能,分析国际顶级智库的知识产品及服务,总结智库通过知识产品发挥影响力的途径,为中国新型智库建设提供借鉴。[方法/过程]采用案例研究方法,主要通过文献调研和网站调研收集数据,同时参考了国际权威的智库排名报告,对外交关系协会的知识产品及其影响力进行考察。[结果/结论] 智库知识产品是智库影响力的基础性来源,知识生产、知识出版、知识服务是智库功能的重要组成部分。

提交时间: 2017-11-05 来自合作期刊:《智库理论与实践》 点击量525下载量280 评论 0

12  尾页  转到  [2 页/ 14 条记录]