广师大-CNLC肝癌分期判断思维链问答数据集
收藏广东省数据知识产权存证登记平台2026-01-19 更新2026-04-17 收录
下载链接:
https://data.gpic.gd.cn/dataStorage/credentialInfo.jhtml?no=20251244000026603
下载链接
链接失效反馈官方服务:
资源简介:
本数据集是基于肝细胞癌医学影像检查报告构建的CNLC肝癌分期判断思维链问答数据集。数据集包含 52414条完整的临床推演样本。每条数据由“虚拟患者影像报告”作为输入,经过深度医学逻辑网络处理,输出包含 “Reasoning(分步推理)” 和 “Answer(最终分期)” 的结构化思维链。 该数据详细覆盖了肿瘤大小、结节数量、血管侵犯特征等关键诊疗指标的逻辑判定过程。该数据集可用于训练医疗AI模型学习类似资深医生的诊断逻辑,显著提升模型在复杂病例下的推理准确率。 在数据生产过程中,通过文本清洗、结构化处理及医学分期规则映射,将原始影像描述转化为标准化的分期判别输入文本;进一步结合大语言模型生成分期推理过程,输出包含“影像特征分析—分期标准匹配—CNLC 分期结论”的多步思维链(Chain-of-Thought)问答数据。每条数据均包含明确的医学推理逻辑与标准化分期标签,适用于医学人工智能模型训练与评估。
提供机构:
广东技术师范大学
创建时间:
2026-01-19
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个专注于肝癌CNLC分期判断的思维链问答数据集,包含52414条基于医学影像报告的临床推演样本,每条数据提供从影像特征分析到分期结论的完整推理过程。它旨在训练医疗AI模型学习资深医生的诊断逻辑,覆盖肿瘤大小、结节数量等关键指标,提升模型在复杂病例下的推理准确率,并适用于医疗辅助诊疗、临床教学等多种应用场景。
以上内容由遇见数据集搜集并总结生成



