分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-09 合作期刊: 《中国科学院院刊》
摘要: 为促进经济发展、社会进步与科技创新,必须大力推动开放科学,开放数据成为开放科学的重要组成。开放数据基础设施由物理实体和虚拟系统组成,是支撑开放数据和满足不同领域数据应用需求的基础,其发展是信息技术演进的客观过程。文章分析了开放数据基础设施的要素,阐明了开放数据基础设施对促进开放科学实施的意义和积极作用,分析了我国开放数据基础设施的现状,针对我国开放数据基础设施存在的不足与挑战提出了发展建议。
分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 科研基础平台是国家科技创新的基础性、战略性平台。近 10 年来,我国科研基础平台在科学观测水平、制造工艺水平、数据获取水平、开放共享水平、科学管理水平、开发利用水平方面取得了跨越式发展,高水平支撑我国科技创新活动。展望未来,新的科研范式变革正在悄然到来,新兴科研信息化基础平台不仅支撑重大科技基础设施和野外台站朝着更大规模、更精确、更先进的方向发展,其本身还将对科研范式变革起到重要的推动作用,成为重大科技突破的“加速器”与“倍增器”,成为我国跻身创新型国家前列和迈进世界科技强国的关键支撑。
分类: 其他 >> 综合 提交时间: 2023-03-19 合作期刊: 《中国科学院院刊》
摘要: 作为科研活动的灵魂,科学数据既是激发科研创新的起点,也是科研活动丰富成果不可或缺的部分。国内外科学数据管理与共享从“积极温和的科学数据政策导向”和“全面细致的科学数据管理实践”两方面开展。通过对国内外发展现状的比较,笔者认为,国内的科学数据政策宏观体系尚待拓展,政策落实仍需继续积累;仍有很多学科门类需要提高数据管理意识和管理水平;科学研究的整体环境有利于开放科学数据文化的孵化,但仍需多利益相关群体的综合协调。未来,积极温和的共享趋势仍占据主流,科学数据的公、私权力争论愈演愈烈,信息技术变革与科学数据管理边界的再认识将持续推动数据开放。
分类: 其他 >> 综合 提交时间: 2023-03-19 合作期刊: 《中国科学院院刊》
摘要: 由于现代科学发现越来越依赖于大规模科学数据的分析处理,如何高效管理科学大数据业已成为当下亟待解决的问题。文章分析了科学大数据的应用场景和需求,阐述了科学大数据在规模动态化、流水线管理、统一访问、数据共享(SPUS)4个方面面临的挑战。提出了包括计算和存储管理、数据流水线管理、数据融合查询管理、数据共享管理4个模块的科学大数据管理系统体系结构,并分析了系统中存在的关键技术问题。最后,介绍了国家重点研发计划项目“科学大数据管理系统”的研发进展及其未来的研究方向。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: NWR数据库的写延时估计,可用于发现实现集群构建和运行成本最小化的节点数量、副本因子的配置组合。现有基于基准测试或模拟队列的方法受限于特定的测试配置和测试环境,只能给出写延时随配置变动的粗略结果。从分析NWR数据库Cassandra的写操作的 (n,r,k) Fork-Join队列结构入手,给出了该类队列期望逗留时间的解析解和NWR数据库写延时的理论模型,可用于建立更完备的写延时结论。分别在模拟队列和Cassandra集群上验证了 (n,r,k) 队列解析解和写延时模型的准确性。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】针对科研团队中分散的科研数据缺乏有效存储、管理, 无法复用的问题, 研发专门的数据知识库管理系统TeamDR。【应用背景】TeamDR 是支撑课题组等科研团队用户完成科研数据组织、存储、管理及协作共享的便捷Web 应用工具; 它采用Java 为主要编程语言, 提供注册即可用的云服务版和本地安装版两个版本。【方法】针对科研多数据类型组织管理问题, 设计动态元数据内容模板, 同时为保证数据存储容量的可伸缩性、查询性能达到较高水平, 采用MongoDB 作为存储设计。【结果】TeamDR 实现了科研团队数据存储与管理方面的重要功能: 如动态元数据模板、分级共享控制、元数据全文检索等, 试用反馈表明它满足了用户在数据存储管理方面的迫切需求。【结论】TeamDR系统可以有效解决团队科研数据存储与管理、共享与协作、发现与关联方面的迫切基本需求。但在功能便捷性、完备性、扩展性方面存在进一步加强的空间。