分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2016-02-02
摘要: 【目的】构建国际重要科研机构 Web 存档系统。【方法】基于 IIPC 开源软件拓展采集存档框架, 在采集端采用三层扩展策略, 在采集客户端增加自动上传及报告等管理功能, 开发WARC文件内容解析模块, 利用Solr进行索引。【结果】在采集端实现三层扩展, 通过增加采集客户端功能提高存档流程自动化程度, 通过增加的WARC文件内容解析功能抽取更多信息, 实现索引及检索服务的扩展。【局限】没有使用大规模采集存档进行检验。【结论】扩展后的采集存档框架初步具备分布式、可扩展、全自动化的特点。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 针对重大公共卫生事件的网络信息展开存档研究,旨在从多维度探索网络信息存档的理论与方法。[方法/过程] 基于代表性重大社会事件网络信息存档实践归纳参考框架,结合新冠肺炎疫情这一事件的具体信息情境,综合构建重大公共卫生事件的网络信息存档架构。[结果/结论] 架构的基本内容为:一方面,阐释重大公共卫生事件网络信息的存档主体、存档信息对象、存档制度与技术保障、存档方案、网络档案库以及产品与服务组成的存档结果;另一方面,明确存档的总体要求:即表现为基于整体目标实施动态优化方案,实现事前全过程管控、全过程社会多元主体协作的基于国家视角的顶层设计与协同。