danielpark/mquad-v1
收藏Hugging Face2023-04-07 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/danielpark/mquad-v1
下载链接
链接失效反馈官方服务:
资源简介:
MQuAD(医疗问答数据集)是一个用于训练医疗聊天机器人的数据集,包含了从eHealth Forum、iCliniq、Question Doctors和WebMD等网站收集的医疗问答数据。数据收集于2017年5月5日。数据集提供了嵌入的问题和答案数组,建议将字符串格式的数组转换为浮点格式以节省嵌入所需的资源和时间。
MQuAD(医疗问答数据集)是一个用于训练医疗聊天机器人的数据集,包含了从eHealth Forum、iCliniq、Question Doctors和WebMD等网站收集的医疗问答数据。数据收集于2017年5月5日。数据集提供了嵌入的问题和答案数组,建议将字符串格式的数组转换为浮点格式以节省嵌入所需的资源和时间。
提供机构:
danielpark
原始信息汇总
MQuAD 数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别:
- 问答
- 文本生成
- 语言:
- 英语
- 韩语
- 标签: 生物学
- 易读名称: 用于训练医疗聊天机器人的医疗领域问答数据集
数据集详情
- 数据集名称: MQuAD (Medical Question and Answering dataset)
- 数据来源:
- eHealth Forum
- iCliniq
- Question Doctors
- WebMD
- 数据收集日期: 2017年5月5日
- 数据格式: 包含嵌入式问题和答案数组,建议将字符串格式的数组转换为浮点格式以节省资源和时间。
使用方法
python from datasets import load_dataset dataset = load_dataset("danielpark/MQuAD-v1")
python from datasets import load_dataset from utilfunction import col_convert import pandas as pd
qa = load_dataset("danielpark/MQuAD-v1", "csv") df_qa = pd.DataFrame(qa[train]) df_qa = col_convert(df_qa, [Q_FFNN_embeds, A_FFNN_embeds])
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



