ChatGPT生成与学者撰写文献摘要的对比研究——以信息资源管理领域为例

Comparative Study on ChatGPT Generation and Scholars Writing of Literature Abstracts: Taking the Field of Information Resource Management as an Example

作者： 张强 ¹ 王潇冉 ² 高颖 ¹ 周洪 ^3,4
作者单位：

1. 华中师范大学信息管理学院

2. 安徽工程大学计算机与信息学院

3. 中国科学院大学经济与管理学院信息资源管理系

4. 中国科学院武汉文献情报中心
提交时间：2023-08-28 23:33:49

摘要: 目的/意义探究ChatGPT生成与学者撰写的中文论文摘要之间的异同，并分析二者之间的内容特征差异，为AI生成学术论文检测及相关研究提供借鉴。方法/过程首先，以信息资源管理领域为例，分别抽取了图书馆学、情报学、档案学近三年各500篇高被引论文，基于获取的论文题目采用Prompt方式应用ChatGPT工具生成对应的摘要文本，构建数据集合；其次，采用了9种机器学习及深度学习算法对ChatGPT生成与学者撰写的摘要文本进行分类检测；最后，从文本特征、主题模型、ROUGE评测对二者的异同进行多角度分析，从而揭示二者之间的异同点。结果/结论基于数据集所训练的主流机器学习及深度学习算法可以有效地分辨摘要是AI生成还是学者撰写，其中BERT和ERNIE的效果最好，而机器学习算法中RF和Xgboost效果最好。ChatGPT生成的摘要字符数量、句子数量较学者撰写的要多，关键词多为模版化的转折性词语；两者的文本主题大部分相同，在“学科体系”、“数字人文”等主题上存在差异；ROUGE及余弦相似度定量分析表明ChatGPT生成的摘要与学者撰写的摘要文本存在明显的“形似”而非“神似”的现象。

ChatGPT 文本分类文本特征论文摘要

来自： 张强
分类： 图书馆学、情报学 >> 情报检索
投稿状态： 未投稿
引用： ChinaXiv:202308.00744 (或此版本 ChinaXiv:202308.00744V1)
DOI:10.12074/202308.00744V1
CSTR:32003.36.ChinaXiv.202308.00744.V1
推荐引用方式： 张强,王潇冉,高颖,周洪.(2023).ChatGPT生成与学者撰写文献摘要的对比研究——以信息资源管理领域为例.中国科学院科技论文预发布平台.doi:10.12074/202308.00744V1 (点此复制)

版本历史

[V1]

2023-08-28 23:33:49

ChinaXiv:202308.00744V1

下载全文

相关论文推荐

1. 关于一个合理的公共产品决定只能来自于一个可以胜任的公共权力机关的论断是否是阿罗不可能定理的推论的文献考证	2024-05-12
2. 结合本地实际统筹做好草原牧区公共阅读推广工作思忖	2024-05-09
3. 基于科学学理论的科技期刊影响力提升策略研究	2024-05-08
4. 人文社科领域中文通用大模型性能评测	2024-05-08
5. 基于改进SEIRS模型的网络舆情衍生话题传播建模与仿真分析	2024-05-06
6. GWO-LSTM预测下的高校网络舆情风险演化研究	2024-05-06
7. 面向信息资源管理学科的话语体系构建思考	2024-05-04
8. 期刊预印本政策的作用机制模型构建——基于扎根理论的分析	2024-05-04
9. 高校图书馆高质量发展总体设计与发展路径的思考	2024-05-04
10. 我国政策体系下科技期刊出版伦理规范化建设研究	2024-05-04


公开评论匿名评论仅发给作者