ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

2023
1

按主题分类

情报检索
1

按作者

按机构

当前资源共 1条

隐藏摘要

点击量

时间

下载量

您选择的条件: 安徽工程大学计算机与信息学院

1. ChinaXiv:202308.00744
下载全文

ChatGPT生成与学者撰写文献摘要的对比研究——以信息资源管理领域为例

分类：图书馆学、情报学 >> 情报检索提交时间： 2023-08-28

张强王潇冉高颖周洪

摘要：目的/意义探究ChatGPT生成与学者撰写的中文论文摘要之间的异同，并分析二者之间的内容特征差异，为AI生成学术论文检测及相关研究提供借鉴。方法/过程首先，以信息资源管理领域为例，分别抽取了图书馆学、情报学、档案学近三年各500篇高被引论文，基于获取的论文题目采用Prompt方式应用ChatGPT工具生成对应的摘要文本，构建数据集合；其次，采用了9种机器学习及深度学习算法对ChatGPT生成与学者撰写的摘要文本进行分类检测；最后，从文本特征、主题模型、ROUGE评测对二者的异同进行多角度分析，从而揭示二者之间的异同点。结果/结论基于数据集所训练的主流机器学习及深度学习算法可以有效地分辨摘要是AI生成还是学者撰写，其中BERT和ERNIE的效果最好，而机器学习算法中RF和Xgboost效果最好。ChatGPT生成的摘要字符数量、句子数量较学者撰写的要多，关键词多为模版化的转折性词语；两者的文本主题大部分相同，在学科体系、数字人文等主题上存在差异；ROUGE及余弦相似度定量分析表明ChatGPT生成的摘要与学者撰写的摘要文本存在明显的形似而非神似的现象。

同行评议状态:待评议

点击量 1973 下载量 253 评论

ChatGPT生成与学者撰写文献摘要的对比研究——以信息资源管理领域为例