NeroUCH/online-health-chating
收藏Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NeroUCH/online-health-chating
下载链接
链接失效反馈官方服务:
资源简介:
---
license: pddl
task_categories:
- question-answering
- table-question-answering
language:
- zh
tags:
- healthcare
- chat
- llm
- medical
size_categories:
- 100K<n<1M
---
---
license: pddl
---
# Online Health Chating
This is the repository for the Online Health Chating project.
which is the dataset of [chathealth](https://github.com/NeroHin/ChatHealth.git) project.
> Alarm: This dataset isfor academic research only and any commercial use and clinical use is prohibited.
## Dataset
We used crawler to collect the data from the following websites:
- [KingNet](http://www.kingnet.com.tw/)
| Item | Size |
| :----: | :----: |
| Row | 91,735 |
- [問 8 健康咨詢](https://tw.wen8health.com/)
| Item | Size |
| :----: | :----: |
| Row | 4,919 |
- [臺灣 E 院](https://sp1.hso.mohw.gov.tw/doctor/)
| Item | Size |
| :----: | :----: |
| Row | 153,251 |
- [家庭醫生](https://www.familydoctor.com.cn/)
| Item | Size |
| :----: | :----: |
| Row | 577,849 |
## LLM Dataset
Then we concatenate the data and split it into train, dev set with 7:3 ratio.
- train.json
- dev.json
| question | answer |
| :----: | :----: |
| e.g. 有什麼方法可以治療腎結石? | 有的,腎結石的治療方法有很多種,包括藥物治療、手術治療、醫療治療、中醫治療等。 |
```json
{
"question": "有什麼方法可以治療腎結石?",
"answer": "有的,腎結石的治療方法有很多種,包括藥物治療、手術治療、醫療治療、中醫治療等。"
}
```
提供机构:
NeroUCH
原始信息汇总
数据集概述
基本信息
- 许可证: pddl
- 任务类别:
- 问答
- 表格问答
- 语言: 中文
- 标签:
- 医疗保健
- 聊天
- 大型语言模型
- 医学
- 大小类别: 100K<n<1M
数据来源
- KingNet: 91,735条记录
- 問 8 健康咨詢: 4,919条记录
- 臺灣 E 院: 153,251条记录
- 家庭醫生: 577,849条记录
数据处理
- 数据通过爬虫从上述网站收集。
- 数据被合并并按7:3的比例分割为训练集和验证集。
- 包含文件:
train.jsondev.json
示例数据
json { "question": "有什麼方法可以治療腎結石?", "answer": "有的,腎結石的治療方法有很多種,包括藥物治療、手術治療、醫療治療、中醫治療等。" }



