five

huatuo_medical_qa_sharegpt

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/AIWizards/huatuo_medical_qa_sharegpt
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库提供HuatuoGPT系列数据集,其核心定位在于提供经过ShareGPT格式转换的医疗领域对话数据,便于研究和应用。数据集来源于HuatuoGPT-sft-data-v1和HuatuoGPT2_sft_instruct_GPT4_50K,包含226042条和50000条样本。数据转换通过convert.py脚本实现,该脚本将原始JSONL格式数据转换为ShareGPT格式,其中问题和答案分别标记为"human"和"gpt"。本仓库采用Apache-2.0授权许可。

This repository provides the HuatuoGPT series datasets, whose core objective is to provide medical domain conversational data converted to the ShareGPT format for research and application purposes. The datasets are sourced from HuatuoGPT-sft-data-v1 and HuatuoGPT2_sft_instruct_GPT4_50K, which contain 226,042 and 50,000 samples respectively. The data conversion is implemented via the convert.py script, which transforms raw JSONL-formatted data into the ShareGPT format, where questions and answers are labeled as "human" and "gpt" respectively. This repository is licensed under the Apache-2.0 license.
创建时间:
2024-07-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
huatuo_medical_qa_sharegpt是一个医疗领域对话数据集,包含27.6万条经过ShareGPT格式转换的问答数据,原始数据来源于HuatuoGPT系列的两个子集。该数据集采用Apache-2.0许可,专门为医疗问答研究和应用设计,通过标准化格式转换便于使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作