肺病文本因果发现数据集
收藏国家基础学科公共科学数据中心2026-03-14 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69b43498195d2623ac629159&type=1
下载链接
链接失效反馈官方服务:
资源简介:
肺病文本因果发现数据集是一个专为评估基于文本数据的因果发现方法而构建的基准数据集,涵盖非结构化文本数据和数值表格数据两种模态数据,包含lung disease、anxiety、stress、attention disorder、yellow fingers、smoking、heredity、allergy等11个变量。本数据集通过仿真生成框架构建,构建时间为2025年6月。数据采用多阶段流程生成:首先,基于预设的因果图结构和概率分布,生成严格符合理论的结构化数据;其次,通过“条件独立性检验”和“因果结构学习”两级统计验证机制确保数据的因果可靠性;最后,利用大语言模型将验证通过的结构化数据转化为自然语言文本描述,并辅以人工核查。
提供机构:
合肥工业大学



