DISC-Med-SFT
收藏魔搭社区2026-05-12 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/AI-ModelScope/DISC-Med-SFT
下载链接
链接失效反馈官方服务:
资源简介:
configs:
- config_name: default
data_files:
- path: DISC-Med-SFT_released.csv
split: train
language:
- zh
license: Apache License 2.0
size_categories:
- 100K<n<1M
tags:
- medical
- sft
- chat
task_categories:
- question-answering
- conversational
tasks:
- chat
- nlp
---
本仓库拷贝自: https://huggingface.co/datasets/Flmc/DISC-Med-SFT
可以通过modelscope SDK下载
```python
from modelscope import MsDataset
train_dataset = MsDataset.load('AI-ModelScope/DISC-Med-SFT',
subset_name='default', split='train').to_hf_dataset()
print(train_dataset)
"""Out[0]
Dataset({
features: ['_id', 'source', 'conversation'],
num_rows: 464898
})
"""
```
This is a repository containing a subset of the DISC-Med-SFT Dataset.
Check [DISC-MedLLM](https://github.com/FudanDISC/DISC-MedLLM) for more information.
配置项:
- 配置名称:default
数据文件:
- 文件路径:DISC-Med-SFT_released.csv
拆分方式:训练集(train)
语言:中文(zh)
许可证:Apache许可证2.0
数据规模分类:100K < 样本数 < 1M
标签:医疗、监督微调(SFT)、对话
任务类别:问答、对话式任务
任务类型:对话、自然语言处理(NLP)
---
本数据集仓库克隆自:https://huggingface.co/datasets/Flmc/DISC-Med-SFT
可通过ModelScope SDK下载,示例代码如下:
python
from modelscope import MsDataset
train_dataset = MsDataset.load('AI-ModelScope/DISC-Med-SFT',
subset_name='default', split='train').to_hf_dataset()
print(train_dataset)
"""Out[0]
Dataset({
features: ['_id', 'source', 'conversation'],
num_rows: 464898
})
"""
本仓库包含DISC-Med-SFT数据集的一个子集。
如需了解更多信息,请查阅[DISC-MedLLM](https://github.com/FudanDISC/DISC-MedLLM)项目。
提供机构:
maas
创建时间:
2024-02-18



