five

danielpark/mquad-v1

收藏
Hugging Face2023-04-07 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/danielpark/mquad-v1
下载链接
链接失效反馈
官方服务:
资源简介:
MQuAD(医疗问答数据集)是一个用于训练医疗聊天机器人的数据集,包含了从eHealth Forum、iCliniq、Question Doctors和WebMD等网站收集的医疗问答数据。数据收集于2017年5月5日。数据集提供了嵌入的问题和答案数组,建议将字符串格式的数组转换为浮点格式以节省嵌入所需的资源和时间。

MQuAD(医疗问答数据集)是一个用于训练医疗聊天机器人的数据集,包含了从eHealth Forum、iCliniq、Question Doctors和WebMD等网站收集的医疗问答数据。数据收集于2017年5月5日。数据集提供了嵌入的问题和答案数组,建议将字符串格式的数组转换为浮点格式以节省嵌入所需的资源和时间。
提供机构:
danielpark
原始信息汇总

MQuAD 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别:
    • 问答
    • 文本生成
  • 语言:
    • 英语
    • 韩语
  • 标签: 生物学
  • 易读名称: 用于训练医疗聊天机器人的医疗领域问答数据集

数据集详情

  • 数据集名称: MQuAD (Medical Question and Answering dataset)
  • 数据来源:
    • eHealth Forum
    • iCliniq
    • Question Doctors
    • WebMD
  • 数据收集日期: 2017年5月5日
  • 数据格式: 包含嵌入式问题和答案数组,建议将字符串格式的数组转换为浮点格式以节省资源和时间。

使用方法

python from datasets import load_dataset dataset = load_dataset("danielpark/MQuAD-v1")

python from datasets import load_dataset from utilfunction import col_convert import pandas as pd

qa = load_dataset("danielpark/MQuAD-v1", "csv") df_qa = pd.DataFrame(qa[train]) df_qa = col_convert(df_qa, [Q_FFNN_embeds, A_FFNN_embeds])

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作