five

Cancer-Myth

收藏
Hugging Face2025-04-16 更新2025-04-17 收录
下载链接:
https://huggingface.co/datasets/Cancer-Myth/Cancer-Myth
下载链接
链接失效反馈
官方服务:
资源简介:
Cancer-Myth是一个包含585个与癌症相关的、含有错误假设的问题的数据集,用于评估大型语言模型在处理实际患者查询中误导性或错误假设的表现。
创建时间:
2025-04-15
搜集汇总
数据集介绍
main_image_url
构建方式
在医疗人工智能领域,准确识别患者提问中的错误前提至关重要。Cancer-Myth数据集由专家团队精心构建,收录了585个包含虚假预设的癌症相关问题。这些数据源于真实患者咨询场景,通过医学专家双重验证确保每个问题的误导性预设符合临床实际。研究人员采用严格的标注流程,对问题中的错误假设进行系统分类和标注,为评估语言模型在复杂医疗语境下的纠错能力提供了基准。
特点
该数据集聚焦于癌症诊疗中的认知误区,其核心价值在于捕捉了患者提问中常见的错误前提类型。每个问题均包含经医学验证的虚假预设,涵盖病因误解、治疗谬误等多维度内容。数据规模虽不足千例,但凭借专家标注的高质量和场景代表性,成为检测语言模型医疗安全性的有效工具。特别值得注意的是,这些问题设计反映了真实医患交流中的典型认知偏差,对评估AI系统的临床适用性具有独特意义。
使用方法
研究人员可通过Hugging Face平台便捷加载该数据集,使用标准接口即可获取验证集数据。典型应用场景包括测试语言模型识别错误前提的能力、评估模型纠正医学谬误的准确性等。在使用时建议结合原始论文提供的评估框架,系统分析模型在虚假预设识别、纠错表述恰当性等维度的表现。该数据集尤其适合作为医疗对话系统的安全测试集,帮助开发者发现并改进模型在关键医疗信息处理中的潜在缺陷。
背景与挑战
背景概述
Cancer-Myth数据集由南加州大学的研究团队于2025年构建,旨在评估大型语言模型在处理癌症患者提问中隐含错误假设的能力。该数据集包含585个经过专家验证的问题,聚焦于医学人工智能领域的关键问题:当患者提问基于错误前提时,语言模型能否准确识别并纠正这些误导性信息。这一研究填补了医疗对话系统中模型鲁棒性评估的空白,为提升AI辅助诊断的可靠性提供了重要基准。
当前挑战
该数据集揭示了医疗AI领域的两大核心挑战:在领域问题层面,现有语言模型难以有效识别患者提问中的错误医学假设,可能导致危险的健康建议;在构建过程中,研究团队面临专家验证的高成本挑战,每个问题需要多位肿瘤学家交叉审核以确保错误前提的准确标注。数据收集还需平衡问题的多样性与临床相关性,既要覆盖常见误区,又要避免过于边缘的医学场景。
常用场景
经典使用场景
在医疗人工智能领域,Cancer-Myth数据集被广泛用于评估大型语言模型处理患者提问中错误预设的能力。该数据集包含585个经过专家验证的癌症相关问题,这些问题均含有误导性假设,为研究者提供了标准化的测试平台。通过模拟真实场景中患者可能提出的错误问题,研究人员能够系统性地分析模型在识别和纠正错误信息方面的表现。
衍生相关工作
围绕Cancer-Myth数据集,学术界已衍生出多项重要研究。部分工作专注于开发新型评估指标,以更精确地量化模型处理错误预设的能力;另一些研究则探索了基于对抗训练的模型改进方法。这些工作共同推动了医疗对话系统评估标准的发展,并为构建更安全的医疗AI提供了技术路线。
数据集最近研究
最新研究方向
在医疗人工智能领域,Cancer-Myth数据集的推出为评估大型语言模型在应对患者提问中的错误预设能力提供了重要基准。当前研究聚焦于提升模型对隐含错误信息的识别与纠正能力,尤其是在癌症这类高敏感性医疗话题中。随着AI辅助诊断系统的普及,如何避免模型因错误预设而生成误导性回答成为学界关注热点。该数据集揭示了现有模型在语义理解和逻辑推理方面的局限性,推动了基于医学知识图谱的增强型对话系统开发。最新研究尝试结合多模态学习和对抗训练策略,以增强模型对复杂医疗场景中潜在风险的警觉性,这对于保障患者安全和提升远程医疗质量具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作