Clear Sky Science · zh
使用带检索增强生成的结构化动态提示改进大语言模型的少样本命名实体识别
为何更智能地解读医学文本很重要
现代医学产生了大量文本——从重症监护记录到关于药物使用的在线对话。这些文字中隐藏着关于疾病、治疗和副作用的重要线索。自动查找并标注这些信息片段的任务称为“命名实体识别”,它可以帮助研究人员追踪疫情、及早发现药物问题并在实时为医生提供支持。但传统系统需要大量人工标注的数据集,这类数据集代价高昂且在罕见或新兴健康问题上常常缺失。本研究探索了如何通过精心设计的提示和智能检索示例,引导类似当前聊天机器人的大语言模型,使其在仅有少量注释样本时也能高质量地完成这一标注任务。
关键词: 生物医学命名实体识别, 少样本学习, 大语言模型, 检索增强生成, 临床文本挖掘