您当前的位置:首页 > 论文浏览
您选择的条件: 张晓娟(4)

1. chinaXiv:201711.01945 [pdf]

信息类、导航类与事务类查询的网络动态性分析

张晓娟
分类: 图书馆学、情报学 >> 情报学

【目的】分析信息类、导航类与事务类查询随时间的网络动态性特征, 以期为搜索引擎性能优化提供相关依据。【方法】利用相关评测指标分别从查询动态﹑文档内容动态和信息需求动态三个角度出发, 分析不同意图类别查询随时间变化所呈现的特征; 针对不同意图类别查询, 分析在不同查询流行度特征中, 其文档内容以及信息需求的变化情况。【结果】在查询流行度分布方面, 信息类查询通常包含波峰, 事务类查询更可能包含多个波峰且具有周期性, 导航类查询通常保持平滑趋势; 信息类查询随网页内容与信息需求变化幅度均比其他两类查询的要大。【局限】观察时间段只有29 天; 未对不包含波峰与包含多个波峰的查询流行度分布图中波峰进行归类与自动识别。【结论】对于信息类查询来说, 搜索引擎尽可能地对其查询结果进行多样化展示; 对于导航类查询来说, 搜索引擎需要保证与之相关权威网页在查询结果中的靠前性; 对于与用户交互行为相关的事务类查询, 应长时间保持相关网页排序不变; 对于一些与娱乐相关事务类查询, 在网页排序中需考虑网页的新颖性。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量278下载量81 评论 0

2. chinaXiv:201711.01979 [pdf]

时态信息检索研究综述

张晓娟; 韩毅
分类: 图书馆学、情报学 >> 情报学

【目的】总结国内外时态信息检索研究现状, 以期为相关学者更好地把握时态信息检索研究问题提供理论基础。【文献范围】在Google Scholar 中分别以检索式“Temporal Information”与“时态信息”且不限定时间范围地进行文献检索,获得部分相关文献后,再结合追溯法最终得到92 篇相关文献。【方法】基于文献调研与归纳总结方法,分别从文档中时态信息抽取、查询中时态信息识别和时间感知排序三方面对时态信息检索的相关研究进行综述与评述。【结果】研究发现时态信息检索研究存在着如下问题和挑战:国外对时态检索研究比较多,而国内的相关研究甚少; 利用表征时间信息的实体与事件演化信息识别文档关注时间的相关研究不足; 缺乏对非周期变化查询的意图预测; 时态信息检索模型实验的可重复性有待提高。【局限】未对该领域的文档采集、文档索引以及相关应用进行文献综述。【结论】构建标准化的评测数据集以及无参数时态信息检索模型将是时态信息检索领域的未来方向研究。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量173下载量128 评论 0

3. chinaXiv:201711.01980 [pdf]

信息类、导航类与事务类查询的网络动态性分析

张晓娟
分类: 图书馆学、情报学 >> 情报学

【目的】分析信息类、导航类与事务类查询随时间的网络动态性特征, 以期为搜索引擎性能优化提供相关依据。【方法】利用相关评测指标分别从查询动态﹑文档内容动态和信息需求动态三个角度出发, 分析不同意图类别查询随时间变化所呈现的特征; 针对不同意图类别查询, 分析在不同查询流行度特征中, 其文档内容以及信息需求的变化情况。【结果】在查询流行度分布方面, 信息类查询通常包含波峰, 事务类查询更可能包含多个波峰且具有周期性, 导航类查询通常保持平滑趋势; 信息类查询随网页内容与信息需求变化幅度均比其他两类查询的要大。【局限】观察时间段只有29 天; 未对不包含波峰与包含多个波峰的查询流行度分布图中波峰进行归类与自动识别。【结论】对于信息类查询来说, 搜索引擎尽可能地对其查询结果进行多样化展示; 对于导航类查询来说, 搜索引擎需要保证与之相关权威网页在查询结果中的靠前性; 对于与用户交互行为相关的事务类查询, 应长时间保持相关网页排序不变; 对于一些与娱乐相关事务类查询, 在网页排序中需考虑网页的新颖性。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量119下载量80 评论 0

4. chinaXiv:201711.02015 [pdf]

时态信息检索研究综述

张晓娟; 韩毅
分类: 图书馆学、情报学 >> 情报学

【目的】总结国内外时态信息检索研究现状, 以期为相关学者更好地把握时态信息检索研究问题提供理论基础。【文献范围】在Google Scholar 中分别以检索式“Temporal Information”与“时态信息”且不限定时间范围地进行文献检索,获得部分相关文献后,再结合追溯法最终得到92 篇相关文献。【方法】基于文献调研与归纳总结方法,分别从文档中时态信息抽取、查询中时态信息识别和时间感知排序三方面对时态信息检索的相关研究进行综述与评述。【结果】研究发现时态信息检索研究存在着如下问题和挑战:国外对时态检索研究比较多,而国内的相关研究甚少; 利用表征时间信息的实体与事件演化信息识别文档关注时间的相关研究不足; 缺乏对非周期变化查询的意图预测; 时态信息检索模型实验的可重复性有待提高。【局限】未对该领域的文档采集、文档索引以及相关应用进行文献综述。【结论】构建标准化的评测数据集以及无参数时态信息检索模型将是时态信息检索领域的未来方向研究。

提交时间: 2017-11-08 来自合作期刊:《数据分析与知识发现》 点击量247下载量193 评论 0

  [1 页/ 4 条记录]