分类: 其他 >> 综合 提交时间: 2023-03-19 合作期刊: 《中国科学院院刊》
摘要: 嵌入式和可穿戴设备正普及大众,各类传感器已可对用户敏感数据采集,无处不在的互联网和普及的云计算以及存储设施,也使得传输和管理这些数据变得越来越容易,深度学习等模型也开始充分挖掘这些数据的价值;然而数据从一开始作为原材料,到最后成为产品提供给用户,其中需要经历一系列的加工和增值过程,在此过程中经济因素将成为最大的推动力量。文章讨论了数据资本化的问题,在此过程中要推动从数据到数据产品的价值链,很多关键的经济问题需要考虑,其中核心问题包括数据作为资产的定价问题,以及隐私保护等。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2020-07-20
摘要: 随着大数据应用的不断深入,大规模结构化、非结构化数据带来的异构数据的融合管理、关联计算和即席查询需求日益突出。现有异构数据融合管理技术与系统存在着数据模型表示能力弱、查询执行实时性差等问题。本文提出了适用于结构化、非结构化数据融合管理和语义计算的智能属性图模型,并定义了相关属性操作符和查询语法。基于该模型实现了异构数据融合管理系统PandaDB,并详细介绍了PandaDB的总体架构、存储机制、查询机制、属性协存、AI算法调度和分布式架构。测试实验和案例证明,PandaDB的协存机制和分布式架构具备较好的性能加速效果,并可应用在关联数据发布、个人相册管理、学术图谱实体消歧等融合数据智能管理的场景。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-24 合作期刊: 《计算机应用研究》
摘要: 传统网络缓存系统中数据包级别的缓存难以实现,信息中心网络的出现使这个难题得以缓解。即使如此,数据包级别的缓存仍然面临严重的扩展性问题。通过分析当前限制数据包级别缓存实现的若干问题,提出了一种分组报文缓存优化方法。这种方法通过根据分组前缀而非单个报文前缀建立索引来减少高速存储器的使用量,同时分组级别的流行度也用于优化缓存决策。定义了大量的评估指标,并通过广泛的实验来评估此方案的性能。实验结果表明,与之前的数据包级别的缓存方案相比,此方法可以大大减少高速存储器使用量,并且在服务器负载减少率、平均跳数减少率和平均缓存命中率方面取得显着改善。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: NWR数据库的写延时估计,可用于发现实现集群构建和运行成本最小化的节点数量、副本因子的配置组合。现有基于基准测试或模拟队列的方法受限于特定的测试配置和测试环境,只能给出写延时随配置变动的粗略结果。从分析NWR数据库Cassandra的写操作的 (n,r,k) Fork-Join队列结构入手,给出了该类队列期望逗留时间的解析解和NWR数据库写延时的理论模型,可用于建立更完备的写延时结论。分别在模拟队列和Cassandra集群上验证了 (n,r,k) 队列解析解和写延时模型的准确性。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-17 合作期刊: 《计算机应用研究》
摘要: 针对NDN(命名数据网络)中确定性缓存和概率性缓存进行研究,提出一种确定性缓存和概率性缓存相结合的混合式NDN缓存策略(HDP)。基于区域划分的思想,在网络边缘采用基于热度的确定性缓存策略,在网络核心采用基于缓存收益和内容热度的概率性缓存策略,从而将两种缓存策略的优势相结合,进一步提高NDN缓存性能。仿真实验表明该策略与现有NDN缓存方法相比,能有效提高缓存服务率和命中率,并有助于降低内容访问延迟,改善用户体验。
分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 仿生概念将生物学和工程技术结合在一起,以最灵活、最高效、最可靠、最经济的方式,为人们改善和创造新的技术设备、促进技术革新、解决技术难题提供新原理、新方法和新途径。在大数据与智能化的时代背景下,信息技术虽不断向前发展但仍然面临诸多挑战,海量数据爆发式增长带来的存储、计算和分析需求,以及随其而来的能耗、效能挑战,迫切需要信息技术寻求新的发展方向。借助生物技术的启发,从生物结构中寻找信息技术革新方案,正成为国际前沿研究方向。DNA数据存储和神经形态计算,作为当前活跃的新兴研究领域,是两个具有代表性的方向,未来发展前景十分广阔。文章主要从这两个方向的发展现状及趋势出发,尝试分析受生物技术启发的信息技术发展的动因、趋势及前景。未来20年,将是生命领域与信息领域交叉融合的重要时间窗口。通过向生命系统学习和模拟,以及借鉴生物技术研究提供的新思路、新原理和新理论,信息领域将会产生若干颠覆性的技术与应用,并影响整个学术界与产业界。
分类: 其他 >> 综合 提交时间: 2023-03-19 合作期刊: 《中国科学院院刊》
摘要: 由于现代科学发现越来越依赖于大规模科学数据的分析处理,如何高效管理科学大数据业已成为当下亟待解决的问题。文章分析了科学大数据的应用场景和需求,阐述了科学大数据在规模动态化、流水线管理、统一访问、数据共享(SPUS)4个方面面临的挑战。提出了包括计算和存储管理、数据流水线管理、数据融合查询管理、数据共享管理4个模块的科学大数据管理系统体系结构,并分析了系统中存在的关键技术问题。最后,介绍了国家重点研发计划项目“科学大数据管理系统”的研发进展及其未来的研究方向。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 在边缘计算的应用场景中,资源的部署和分配是重要问题。针对边缘计算网络中的负载均衡需求,提出一种基于集中控制的调度机制。首先决定在哪些网络节点部署边缘计算功能,再针对用户的数据和请求,在满足相关负载均衡约束的前提下通过调度尽量降低流量的平均端到端延迟。评估结果表明,边缘计算节点的数量、计算资源和网络资源的负载均衡程度均可能影响流量的平均端到端延迟。只需选择少量合适的节点作为边缘计算节点,再将计算资源和网络资源的负载均衡调配到合适程度即可有效降低平均端到端延迟。
分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 现代科学研究和工程技术中,高性能计算应用将建模、算法、软件研制和计算模拟融为一体,已成为高性能计算机实现在重大科学发现的前沿基础科学研究领域应用的必要纽带。文章从高性能计算机的发展趋势、不同科学计算应用对高性能计算机的需求谈起,回顾和剖析了来自中国科学院多个学科的科学家协同通关,发挥学科深度交叉的优势,在“曙光1000”并行计算机上完成了多个应用软件并在天然DNA的整体电子结构理论计算、激光晶体材料(LBO)电子态理论分析及广义本征值并行计算等方面取得了令人瞩目的高水平成果的案例。多年来,中国科学院始终位列我国科学计算应用发展的前沿。在应用水平、计算规模及成果显示度均取得了长足进步的背景下,文章选取了大气科学、生命科学、高能物理、计算化学和材料科学等典型传统科学计算应用,从科学家的视角对它们的现状、领域发展促进及未来趋势作了介绍,以期能引发读者更深入的思考与关注。最后,提出了进一步发展我国科学计算的若干建议。
分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 科研基础平台是国家科技创新的基础性、战略性平台。近 10 年来,我国科研基础平台在科学观测水平、制造工艺水平、数据获取水平、开放共享水平、科学管理水平、开发利用水平方面取得了跨越式发展,高水平支撑我国科技创新活动。展望未来,新的科研范式变革正在悄然到来,新兴科研信息化基础平台不仅支撑重大科技基础设施和野外台站朝着更大规模、更精确、更先进的方向发展,其本身还将对科研范式变革起到重要的推动作用,成为重大科技突破的“加速器”与“倍增器”,成为我国跻身创新型国家前列和迈进世界科技强国的关键支撑。
分类: 其他 >> 综合 提交时间: 2023-03-19 合作期刊: 《中国科学院院刊》
摘要: 作为科研活动的灵魂,科学数据既是激发科研创新的起点,也是科研活动丰富成果不可或缺的部分。国内外科学数据管理与共享从“积极温和的科学数据政策导向”和“全面细致的科学数据管理实践”两方面开展。通过对国内外发展现状的比较,笔者认为,国内的科学数据政策宏观体系尚待拓展,政策落实仍需继续积累;仍有很多学科门类需要提高数据管理意识和管理水平;科学研究的整体环境有利于开放科学数据文化的孵化,但仍需多利益相关群体的综合协调。未来,积极温和的共享趋势仍占据主流,科学数据的公、私权力争论愈演愈烈,信息技术变革与科学数据管理边界的再认识将持续推动数据开放。
分类: 管理学 >> 科学学与科技管理 提交时间: 2023-07-09 合作期刊: 《中国科学院院刊》
摘要: 开放科学蓬勃发展,推动着全球科学研究范式的变革。开放科学治理旨在逐步加大科技进步过程的透明性和全球参与度,确保全球范围的低成本开放,加快成果的全球传播和共享,提升全民的科学素养和人文素养。随着开放科学发展势头愈发强劲,一系列挑战逐渐涌现。通过对开放科学治理框架模型进行分析研究,有助于进一步梳理治理逻辑,明确治理主体和治理机制,将有效推进我国开放科学治理体系构建,加速我国科学技术发展,助力我国于 20402050 年成为全球知识共同体的领航人之一,推动我国世界科技强国战略目标实现。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】针对科研团队中分散的科研数据缺乏有效存储、管理, 无法复用的问题, 研发专门的数据知识库管理系统TeamDR。【应用背景】TeamDR 是支撑课题组等科研团队用户完成科研数据组织、存储、管理及协作共享的便捷Web 应用工具; 它采用Java 为主要编程语言, 提供注册即可用的云服务版和本地安装版两个版本。【方法】针对科研多数据类型组织管理问题, 设计动态元数据内容模板, 同时为保证数据存储容量的可伸缩性、查询性能达到较高水平, 采用MongoDB 作为存储设计。【结果】TeamDR 实现了科研团队数据存储与管理方面的重要功能: 如动态元数据模板、分级共享控制、元数据全文检索等, 试用反馈表明它满足了用户在数据存储管理方面的迫切需求。【结论】TeamDR系统可以有效解决团队科研数据存储与管理、共享与协作、发现与关联方面的迫切基本需求。但在功能便捷性、完备性、扩展性方面存在进一步加强的空间。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】提出一套科学数据管理计划的细化构成规范; 并依此从可操作角度构建数据监护模型。【方法】对国际上主要科研管理机构的数据管理计划规范进行调研和统计; 并结合当前科研数据管理的需求与特点进行补充。【结果】形成8 大基本构成要素和39 个子要素的数据管理计划细化构成规范, 并构建出一种以数据管理计划为核心驱动的数据监护模型。【结论】数据管理计划细化构成规范可以完整、准确规范和指导科研数据的管理活动, 在操作层面上也可以有效地控制和约束科研全生命周期的数据监护过程。
分类: 物理学 >> 普通物理:统计和量子力学,量子信息等 提交时间: 2023-06-15
摘要: 【目的】提出适用于我国科技期刊的关联数据存缴共享政策分级模板,为我国科技期刊数据政策制定提供基本要素、结构框架和主要内容的参考。【方法】通过文献调研、实证研究等方式,分析我国科学数据管理规范体系,研究梳理国际出版商期刊数据政策、国际组织期刊数据政策框架建议、我国科学数据管理体系等内容,分析我国科技期刊数据政策基本要素。【结果】根据前述调研分析,提出一套通用型科技期刊数据政策分级模板,可依据期刊实际需要自由组合、个性定制,可为不同期刊制定数据政策提供参考。【结论】目前已有44家期刊采用此模板,帮助部分科技期刊完成数据政策从无到有的转变,有利于论文关联数据的开放共享和长期存储。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-04-17 合作期刊: 《计算机应用研究》
摘要: 计算速度对于期权交易者至关重要,关系到如何有效地制定价格并评估相应的风险,而云并行计算提供的随收随付制(pay-as-you-go)可以实现低成本运行。在微软云平台Windows Azure的基础上,开发了基于云并行计算的期权定价试点云软件AzureOP,该软件以较低的费用提供了低风险和高速度,并给出了AzureOP对于美式期权价格的模拟结果,绘制了对应的期权价格定价曲线和定价曲面。最后,对云并行计算在金融应用上的优势和不足进行了总结和讨论,同时举例说明了试点云软件AzureOP的具体细节。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 对《科学数据管理办法》出台以来的相关研究、落实情况及落实的影响因素等相关问题进行探讨,以期为《科学数据管理办法》的进一步落实提供参考与借鉴。[方法/过程] 首先,系统梳理《科学数据管理办法》的相关研究成果;然后,调研科学数据管理利益相关机构对《科学数据管理办法》的落实情况;其次,从积极和消极两个方面分析《科学数据管理办法》落实的影响因素;最后,提出《科学数据管理办法》落实的几点推进策略。[结果/结论] 研究发现,目前《科学数据管理办法》的落实推进以各级政府职能部门为主,总体落实情况尚不理想;推动《科学数据管理办法》落实的积极因素包括数据价值凸显、数据设施完善、国家高度重视、政府推进明显、相关研究丰富等,阻碍《科学数据管理办法》落实的消极因素包括利益相关者意识淡薄、相关机构管理失位、落实规划定位模糊、监督激励机制缺失、实践研究数量不足等。可以从提高认识加强实践研究、推动机制体制建设、提高利益相关者合作强度等方面推进《科学数据管理办法》的落实。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-05-20 合作期刊: 《计算机应用研究》
摘要: 基于对理论和实践两个层面的认识,Handle系统和域名系统将在未来很长一段时间内共存,而两种标志解析系统的解析协议和编码规则并不兼容,导致两者之间的数据空间无法共享,信息无法流通,降低了用户体验。因此,两种标志符解析系统的互联互通是当前亟需解决的一个问题。通过分析已有解决方案的利弊,发现协议数据单元与协议本身的分离可解决两个系统的解析协议和编码规则不兼容问题。利用这一分离机制,设计并实现了一种基于代理服务器的Handle系统与域名系统互联互通机制。实验结果表明,相对于传统客户端-服务器模式而言,该机制在不同应用场景下解析响应时间增量占比小,均在可接受范围内。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》
摘要: [ 目的 / 意义 ] 系统梳理国内图书馆众包相关研究成果,总结研究现状,指出不足之处,并提出 未来可进一步尝试的研究方向,以期为今后相关研究提供参考。[ 方法 / 过程 ] 以国内图书馆众包研究方 向的论文为研究对象,对其具体内容进行分析,归纳出当前研究主题。[ 结果 / 结论 ] 分析结果发现,国 内当前研究多集中在图书馆服务工作众包、信息资源建设众包、图书馆员众包、国外图书馆众包实践经验 介绍以及图书馆众包的冷思考等几个方面,此类研究大多停留在理论探讨阶段,实证研究及其实施效果的 评价研究不足,缺乏比较研究与失败案例的介绍。后续还需结合上述不足之处进行深层次的探讨与研究, 以拓展研究视角,充实研究内容。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]回顾总结我国情报学近20年来的历史进程,对于了解我国情报学的发展脉络具有重要意义,能够为情报学后续研究提供参考和指引。[方法/过程]以《情报学进展》第1-11卷刊载的文章为研究对象,运用内容分析法归纳文章选题、主题并总结各选题特点;在此基础上预测未来一定进展周期内我国情报学在理论研究、范式方法、应用实践三个方面的发展趋势。[结果/结论]分析发现情报学基础理论、信息资源及其管理、新兴信息技术等是《情报学进展》所载文章的主要选题,各选题呈现出不同特点。未来,智能化的情报学将融合多学科,面向科学发现,服务国民经济建设和国防安全,为国家新型智库建设提供智力支持。