• 基于ChatGPT和零样本提示的临床量表文本中结构化项目信息抽取研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2024-08-06

    摘要: [目的/意义]实现无标注数据情况下使用ChatGPT从自由临床量表文本中抽取结构化的项目信息,高效推进医学量表资源的结构化与智能化。[方法/过程]定义了包含8类属性、兼顾临床量表测量概念结构差异性的项目信息抽取框架,收集59个临床常用心理评定量表文档自建数据集;分类设计零样本提示,调用ChatGPT-3.5和ChatGPT-4官方接口进行实验;多角度分析ChatGPT不同版本在处理不同临床量表文本时的抽取表现和可能影响因素。[结果/结论]来源属性抽取表现最佳,Micro-F1和Macro-F1最低也分别达98.90%和97.83%;反应选项、使用说明和计分规则随后;编号和项目指令居中;临床解释最低,Micro-F1和Macro-F1分别为47.73%和45.51%。ChatGPT-4整体表现更优,但部分属性召回率弱于ChatGPT-3.5。量表测量概念层级、维度数、项目数和文本长度的增加会降低模型表现。综上,ChatGPT能够高效辅助医学量表资源的结构化,尤其在处理简单量表时。