Current Location:home > Detailed Browse

Article Detail

基于IIPC开源软件拓展构建国际重要科研机构Web存档系统

Submit Time: 2016-02-02
Author: 吴振新 1 ; 张智雄 1 ; 谢靖 1 ; 胡吉颖 1 ;
Institute: 1.中国科学院文献情报中心;

Abstracts

【目的】构建国际重要科研机构 Web 存档系统。【方法】基于 IIPC 开源软件拓展采集存档框架, 在采集端采用三层扩展策略, 在采集客户端增加自动上传及报告等管理功能, 开发WARC文件内容解析模块, 利用Solr进行索引。【结果】在采集端实现三层扩展, 通过增加采集客户端功能提高存档流程自动化程度, 通过增加的WARC文件内容解析功能抽取更多信息, 实现索引及检索服务的扩展。【局限】没有使用大规模采集存档进行检验。【结论】扩展后的采集存档框架初步具备分布式、可扩展、全自动化的特点。
Download Comment Hits:3489 Downloads:1229
From: 王颖
DOI:10.12074/201602.00006
Recommended references: 吴振新,张智雄,谢靖,胡吉颖.(2016).基于IIPC开源软件拓展构建国际重要科研机构Web存档系统.[ChinaXiv:201602.00006] (Click&Copy)
Version History
[V1] 2016-02-02 13:27:55 chinaXiv:201602.00006V1 Download
Related Paper

Download

Current Browse

Change Subject Browse

Cross Subject Browse

  • - NO