分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-04-24
摘要: 摘要: 目的 对国内外语义新颖性研究相关进展进行归纳整理,总结相关技术,为后续研究 提供参考。 文献范围 利用“Novelty of the literature”“semantic novelty”“文献新颖性” “语义新颖性 and 文献评价”等检索式进行检索,经过阅读整理并对具有代表性的相关理 论研究进行溯源,最终筛选出 70 篇文献进行评述。 方法 对国内外语义新颖性相关研究 进行总结梳理,围绕新颖性定义、新颖性评价指标和不同评价方法等分析科技文献语义新 颖性评价的发展现状及未来趋势。 结果 语义新颖性评价逐渐受到学界的广泛关注,已有 相关研究对语义内容进行挖掘评价,但尚未形成统一的度量指标。 局限 现有的文献新颖 性多从外部特征进行评价,直接以语义新颖性为主题的研究文献数量较少,在支撑综述方 面存在局限性。 结论 科技文献的语义新颖性评价根本在于语义内容的新颖性,定量研究 已成为主流研究方法,但评价指标的计算方式尚需明确,未来的新颖性评价发展方向应结 合定性与定量方法全面分析,实现科学、合理的综合学术评价。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-08-27 合作期刊: 《图书情报工作》
摘要: [目的/意义]为更好地提升科技文献的语义丰富化效果,对国内外科技文献语篇元素标注模型、技术和方法进行调研总结,为文本挖掘、科技论文知识抽取、语义分析系统研究者提供借鉴。[方法/过程]利用学术网站搜索和相关数据库搜索引擎,对涉及科技论文标注、语篇元素、知识抽取、句子识别和自动文章分类等参考文献以及研究报告进行深入阅读和调研,对语篇元素自动标注模型以及相关工作进展进行研究总结。[结果/结论]科技文献语篇元素标注具有非常重要的实际应用价值,构建标注模型需充分考虑构建思想、标注领域和标注粒度以及标注技术手段等方面。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》
摘要: [目的/意义] 为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程] 通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研究进展,总结当前引用对象研究不足并提出未来发展方向。[结果/结论] 引用对象从语义层面评价文献学术研究的贡献和利用价值,为引文分析方法增加了重要维度。引用对象研究需要从理论、技术和应用三个方向进行深化:理论上,加强多维度引用对象特征的研究和分析;技术上,探索基于大规模语料的自动化识别方法;应用上,尝试基于引用对象的科研评价服务。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-09 合作期刊: 《中国科学院院刊》
摘要: 开放科学确立了一种可重现、透明、共享和合作的科学研究新范式。对于全球科技期刊而言,开放科学本质上带来了学术交流模式的变革。文章简要梳理开放科学的基本概念及其发展趋势,分析开放科学给全球科技期刊带来的主要挑战,总结全球科技期刊在应对开放科学挑战时采取的一些新举措,提出我国科技期刊在开放科学环境下发展的相关建议。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 针对国内科技界对突发公共卫生事件下科研成果开放共享的总体情况和相关制度规范认识不足的现实情况,对突发公共卫生事件下国际科研成果开放共享的主要发展脉络进行梳理,希望能够反映其主要发展历程和相关制度规范的整体概貌,给我国科研机构、政府部门和学界提供参考。[方法/过程] 通过回顾突发公共卫生事件下科研成果开放共享20多年来的发展历史,根据发展历程中主要关注点的不同,将其分为三个阶段,并对各个阶段的主要事件、重要文献、问题理念、政策规范、实践特点等进行总结梳理。[结果/结论] 经过三个阶段的发展,相关的规范和机制逐步形成并完善。自2020年以来,突发公共卫生事件下科研成果开放共享的方式方法进一步快速发展,得到了全球科技界的高度关注,引发新冠肺炎疫情改变传统学术交流及科研范式的感慨,也突显出还有一些问题值得进一步深入研究和解决。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 人工智能(AI)正引发链式反应般的科学突破,引领新一轮科技革命和产业变革,图书文献情报领域如何利用AI技术提供智慧知识服务与智能情报系统是当前行业关注的焦点与热点。[方法/过程] 从图书情报行业内外综合分析AI技术与大数据为知识服务范式带来的新平台、新服务以及新机遇与新挑战,提出"AI技术+大数据"驱动的智慧知识服务生态体系建设的总体思路,从智慧数据、智慧中台与智慧服务3个层面共同构建"科情大脑",提供覆盖科技管理、科技创新与社会学术信息环境的开放智慧知识服务生态环境。[结果/结论] 以中国科学院文献情报中心的文献情报数据湖、智能知识服务引擎、智慧知识发现、智慧知识管理、智能情报分析系统以及智能感知环境6个方面进行探索建设,取得有意义的成效。面向未来,阐明AI技术在面向大数据治理、细粒度知识识别、精准服务提供等方面,仍需要在数据、技术以及服务模式上进一步提升。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》
摘要: [目的/意义] 回顾总结孟连生先生在文献计量学理论方法研究、数据体系建设、应用实践研究、国际学术交流和人才培养方面的贡献,展现先生在艰苦条件下求索开创、严谨治学的精神风貌。[方法/过程] 采用文献调研、人物访谈等研究方法,从先生的研究过程、研究成果、意义及影响等方面进行阐述。[结果/结论] 先生具有创新意义的学术探索促进了文献计量学研究与应用在中国的发展,扩大了中国在该领域的国际影响。通过引领创建CSCD和DISC数据库,推进文献计量学方法在科技文献检索、科技期刊评价、科学活动评价方面的应用,促进了文献计量学研究,这些数据库是中国文献计量学发展的重要标志和成就。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-03-13
摘要: ChatGPT是由OpenAI公司研发的对话系统。它的对外表现是一个聊天机器人,实际本质是人工智能生成技术,关键基础是基于生成式预训练的变换器,核心技术是InstructGPT,主要特点是与前期类似产品相比,编造事实大幅下降,生成的毒内容更少。本文从ChatGPT的技术体系、相关研究与实践、应用情况等方面进行了系统的调研。分析了人工智能技术迅速发展带来的启示与ChatGPT对科学研究和文献情报工作的影响。提出了对文献情报领域的八条建议。总体来说,文献情报领域在AI时代要找到自己的不同价值取向,既要守正继承传统科学研究范式,也要拓展以ChatGPT等新技术助力科学研究。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-03-09
摘要: 目的 研究预印本学术交流体系参与主体的各自权益,为我国预印本学术交流体系的建设提出建议。 方法 基于arXiv、bioRxiv、ChemRxiv、Research Square、SSRN、F1000Research六个预印本平台、相关科技期刊和基金项目的权益政策,分析梳理预印本作者、预印本平台、预印本读者、科技期刊和预印本资助者的主要权益,提出建设我国预印本学术交流体系的建议。 结果 总结出了预印本作者拥有的七项权益、预印本平台拥有的四项权益、预印本读者拥有的四项权益、科技期刊拥有的三项权益和预印本资助者拥有的二项权益。 结论 我国预印本学术交流体系在建设中应注意以下四点:在我国预印本平台的建设中高度重视权益政策的制定与展示,在合理划分科技期刊与预印本平台权益的基础之上推进双方合作,加强基金项目等资助者对预印本权益政策的制定与展示,提升我国科研人员对预印本学术交流权益规范的认知。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-03-06
摘要: 目的 分析当前国际预印本平台的功能创新与未来发展方向,为我国预印本平台功能开发给予参考和借鉴。 方法 围绕国际预印本平台在创新社区合作、评估评价、编辑服务、评议方式等方面的功能创新进行总结梳理,分析每个平台对比常规功能所推出的创新服务实践功能。 结果 当前国际预印本平台五个功能创新分别为:构建创新合作社区模式、集成多方学术交流讨论窗口、服务作者提升论文水平、推动论文开放评阅以及提供科研评估功能。 结论 归纳分析当前国际预印本平台功能创新的发展趋势,并据此为我国预印本平台的功能开发与建设提供建议,以期进一步提升预印本在我国学术交流中的作用。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2019-03-17
摘要: 文梳理了科技预印本库的国际发展趋势;从国际重要预印本库自身、科研基金为代表的科技管理部门、以及科技期刊三个方面,分析了当前预印本交流的相关政策动向;研究提出了我国科技预印本库建设中面临的五个政策挑战:政策定位不清晰,政策机制不完善、高层管理政策缺失、得不到期刊出版政策支持、政策起点高度不够;最后提出了发展我国科技预印本交流体系的四条政策建议。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》
摘要: 【目的】为解决已有方法中单词特征表示不具有语义信息这一问题, 对词嵌入表示特征在关系抽取中的作 用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征, 利用朴素贝叶斯模型、决策树 模型和随机森林模型进行对比实验, 并选出代表全部特征的有效特征子集。【结果】使用全部特征时, 决策树算 法的准确率达到0.48, 关系抽取效果最佳, Member-Collection( E2 , E1 )类型关系的 F1 值达到0.70, 特征排序结果表 明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高, 以及词向量训练及 方法的相关参数需要进一步优化。【结论】实验证明选取的三种类型特征的有效性, 词嵌入表示级别特征在实体 关系抽取问题中可以发挥重要作用。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2017-11-21
摘要: 质量控制是预印本服务中的重要环节。当前国际通行的预印本质量控制方法包括“上传者和作者的研究身份审核”“论文格式完整性审核”和“论文内容学术性和真实性审核”三方面;人工审核为主、机器审核为辅。中科院ChinaXiv预发布平台按国际通行模式建立了质量控制机制,包括论文常规审核制、领域专家评审制、论文开放评议制、问题论文撤稿制和非诚信作者名单制等。未来可在质量控制机制公开透明、充分发挥开放评议作用、加强国际交流方面做出改进。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2017-11-21
摘要: 预印本指尚未在同行评议学术期刊上正式发表的科研论文手稿。近年来,随着开放获取运动发展,预印本平台进入快速发展阶段。国际学术机构的预印本政策成为预印本发展的重要影响因素。本文将国际学术出版机构预印本政策划分为预印本投稿政策和预印本存档政策,梳理当前学术出版机构预印本政策的5种模式,并以web of science为数据源,选取国内科研作者发文量最多的期刊/出版机构进行典型分析,发现目前国际学术出版机构大多采取积极的预印本政策,不同的支持政策存在细微差异,并呈现一定的规律特点。最后,根据预印本政策分析结果,从科研作者、期刊、ChinaXiv角度提出相应建议。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2017-11-21
摘要: 为满足保护作者首发权、促进中国优秀科研成果率先保存并服务于中国科技界的需要,中国科学院科技论文预发布平台(ChinaXiv)开展项目建设,旨在鼓励科研人员第一时间在公共预印本平台上公布科研成果,通过该平台听取同行的评议和建议,促进更大范围的学术交流,并推动科研成果的开放获取。本文以工作实践为基础,从建设背景、系统建设及服务、领域拓展与培育、组织管理机制、宣传推广模式、建设现状以及未来发展等多个方面介绍了ChinaXiv如何构建国际通行模式规范运营的预印本服务平台,为其他预印本平台建设提供参考。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】通过采用语义识别、知识关系计算等方法提升科技文献检索系统的服务功能和效果, 使之能够呈现更加丰富的知识化语义信息, 将更多的知识点和知识关系展现给用户。【方法】应用数据挖掘和关系计算工具,深度识别和抽取科技文献中的语义知识, 分析、计算、构建语义关系, 并将得到的语义知识和语义关系建立多维语义索引树, 设计新的数据组织呈现模型。【结果】研发语义丰富化检索示范系统, 在科技文献检索应用过程中充分揭示语义信息, 丰富检索体验。【局限】选取的试验数据集合不够充足, 缺少其他领域应用对比。【结论】本文模型设计给用户带来更多的知识层面的关联、揭示和导航, 提升了检索系统体验。同时分析了设计模型的不足之处, 探索改进方法。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】拓展以物种为中心的植物物种多样性抽取框架, 探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究, 以物种为中心, 设计包含多种实体及实体间关系的知识抽取框架, 利用已有的众多专业数据库, 设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架, 探索实现多种实体及实体间关系的语义知识抽取方法, 拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大, 且实体间关系的类型局限于共现、上下位类、语法关系几类, 还需进一步研究。【结论】本研究拓展了植物物种多样性抽取内容和思路, 可有效支持语义检索、科学计算。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》
摘要: 【目的】拓展以物种为中心的植物物种多样性抽取框架, 探索实现语义知识抽取方法。【方法】结合当前生物多样性抽取的主流研究, 以物种为中心, 设计包含多种实体及实体间关系的知识抽取框架, 利用已有的众多专业数据库, 设计并实现相应的识别方法。【结果】设计以物种为核心的知识抽取框架, 探索实现多种实体及实体间关系的语义知识抽取方法, 拓展植物物种多样性领域抽取内容和思路。【局限】实体识别的完整性和准确性受底层知识库影响较大, 且实体间关系的类型局限于共现、上下位类、语法关系几类, 还需进一步研究。【结论】本研究拓展了植物物种多样性抽取内容和思路, 可有效支持语义检索、科学计算。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2017-11-06
摘要: 在开放获取、开放科研等大潮的影响下,预印本和基于预印本平台的学术交流得到科学界高度关注。本文对2013年以来国际上预印本平台建设的相关情况进行总结梳理,研究提出当前国际预印本发展的7个主要态势。研究表明,以arXiv、SSRN为代表的传统预印本平台通过可持续发展模式探索,赢来大发展;以BioRXiv、ChemRXiv等为代表的新预印本平台如雨后春笋般纷纷推出,带来预印本平台的大繁荣;而在科学界,基于论文手稿的预印本交流模式,得到学术团体、学协会、科技管理机构、基金组织,甚至是传统出版商的广泛认可,表明以学界自治为基础的预印本学术交流模式正在改变传统的以期刊为主体的学术交流模式。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》
摘要: 【目的】开发网络信息存档WARC 文件的解析与索引系统, 充分挖掘科技网站存档资源价值。【应用背景】在网络资源采集存档领域, WARC 文件格式获得了广泛的应用。随着网络信息的多样化, 已有的WARC 文件索引工具越来越难以满足用户多样性的查询需求。【方法】采用模块化方案解析WARC 文件。分析比较常用的索引工具, 选择Solr 平台开发全文索引系统。【结果】实现对WARC 文件基于内容的检索访问服务, 并在WARC的索引中增加了学科分类、资源类型和存档时间等分面检索内容, 从多维度对WARC 文件内容进行揭示。【结论】向用户提供了丰富的科技网站存档数据信息, 提高了用户检索访问效率。