ShenNong TCM Dataset 神农中医药数据集
收藏超神经2025-02-13 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/36295
下载链接
链接失效反馈官方服务:
资源简介:
ShenNong TCM Dataset(神农中医药数据集)是专门为中医药领域设计的大规模语言模型训练和评估的数据集。包含超 11 万个的指令数据,这些数据通过以实体为中心的自指令方法 (entity-centric self-instruct) 生成,围绕中医药领域的核心实体和不同意图场景,不仅能够提升模型在中医药相关问题的回答能力,还能辅助中医诊断,提供个性化的医疗建议。
ShenNong TCM Dataset is a large-scale dataset specifically designed for training and evaluating large language models in the field of Traditional Chinese Medicine (TCM). It contains over 110,000 instruction data entries, which are generated via the entity-centric self-instruct method. Centering around core entities in the TCM domain and various intent scenarios, this dataset can not only enhance the ability of language models to answer TCM-related questions, but also assist in TCM diagnosis and provide personalized medical advice.
创建时间:
2024-11-29
搜集汇总
数据集介绍

背景与挑战
背景概述
ShenNong TCM Dataset 是一个专门为中医药领域设计的大规模语言模型训练和评估数据集,包含超11万个指令数据,通过以实体为中心的自指令方法生成,覆盖中医药核心实体和多种意图场景。该数据集旨在提升模型在中医药问题回答、辅助诊断和提供个性化医疗建议方面的能力,适用于医学、自然语言处理和大语言模型应用。
以上内容由遇见数据集搜集并总结生成



