five

TCM-SD

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/TCM-SD
下载链接
链接失效反馈
官方服务:
资源简介:
中药 (TCM) 是一种天然,安全,有效的疗法,已在世界范围内传播和应用。独特的中医诊疗系统需要对隐藏在以自由文本书写的临床记录中的患者症状进行全面分析。先前的研究表明,该系统可以借助人工智能 (AI) 技术 (例如自然语言处理 (NLP)) 进行信息化和智能化。但是,现有数据集的质量和数量都不足以支持TCM中数据驱动的AI技术的进一步发展。因此,在本文中,我们将重点放在中医诊疗系统的核心任务-辨证论治 (SD) 上,并介绍了第一个针对SD的公共大规模基准,称为TCM-SD。我们的基准包含涵盖148综合征的54,152真实临床记录。此外,我们在TCM领域中收集了大规模的未标记文本语料库,并提出了一种特定于领域的预训练语言模型,称为ZYBERT。我们使用深度神经网络进行了实验,以建立强大的性能基线,揭示SD中的各种挑战,并证明了特定领域的预训练语言模型的潜力。我们的研究和分析揭示了整合计算机科学和语言学知识以探索中医理论的经验有效性的机会。
提供机构:
OpenDataLab
创建时间:
2022-12-21
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作