five

NeroUCH/online-health-chating

收藏
Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NeroUCH/online-health-chating
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: pddl task_categories: - question-answering - table-question-answering language: - zh tags: - healthcare - chat - llm - medical size_categories: - 100K<n<1M --- --- license: pddl --- # Online Health Chating This is the repository for the Online Health Chating project. which is the dataset of [chathealth](https://github.com/NeroHin/ChatHealth.git) project. > Alarm: This dataset isfor academic research only and any commercial use and clinical use is prohibited. ## Dataset We used crawler to collect the data from the following websites: - [KingNet](http://www.kingnet.com.tw/) | Item | Size | | :----: | :----: | | Row | 91,735 | - [問 8 健康咨詢](https://tw.wen8health.com/) | Item | Size | | :----: | :----: | | Row | 4,919 | - [臺灣 E 院](https://sp1.hso.mohw.gov.tw/doctor/) | Item | Size | | :----: | :----: | | Row | 153,251 | - [家庭醫生](https://www.familydoctor.com.cn/) | Item | Size | | :----: | :----: | | Row | 577,849 | ## LLM Dataset Then we concatenate the data and split it into train, dev set with 7:3 ratio. - train.json - dev.json | question | answer | | :----: | :----: | | e.g. 有什麼方法可以治療腎結石? | 有的,腎結石的治療方法有很多種,包括藥物治療、手術治療、醫療治療、中醫治療等。 | ```json { "question": "有什麼方法可以治療腎結石?", "answer": "有的,腎結石的治療方法有很多種,包括藥物治療、手術治療、醫療治療、中醫治療等。" } ```
提供机构:
NeroUCH
原始信息汇总

数据集概述

基本信息

  • 许可证: pddl
  • 任务类别:
    • 问答
    • 表格问答
  • 语言: 中文
  • 标签:
    • 医疗保健
    • 聊天
    • 大型语言模型
    • 医学
  • 大小类别: 100K<n<1M

数据来源

  • KingNet: 91,735条记录
  • 問 8 健康咨詢: 4,919条记录
  • 臺灣 E 院: 153,251条记录
  • 家庭醫生: 577,849条记录

数据处理

  • 数据通过爬虫从上述网站收集。
  • 数据被合并并按7:3的比例分割为训练集和验证集。
  • 包含文件:
    • train.json
    • dev.json

示例数据

json { "question": "有什麼方法可以治療腎結石?", "answer": "有的,腎結石的治療方法有很多種,包括藥物治療、手術治療、醫療治療、中醫治療等。" }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作