UCSD-AI4H/covid_qa_ucsd
收藏数据集概述
数据集描述
数据集摘要
- COVID-Dialogue-Dataset-English: 这是一个关于COVID-19和其他类型肺炎的英语医疗对话数据集。患者担心可能感染COVID-19或其他肺炎,咨询医生并获得建议。共有603次咨询。
- COVID-Dialogue-Dataset-Chinese: 这是一个关于COVID-19和其他类型肺炎的中文医疗对话数据集。患者担心可能感染COVID-19或其他肺炎,咨询医生并获得建议。共有1393次咨询。
支持的任务和排行榜
该数据集用于问答任务。对于中文数据,还有一个COVID-19对话生成模型可用。更多信息可在arXiv预印本中找到。
语言
单语种数据集,包含英语(EN)和中文(ZH)。
数据集结构
数据实例
一个对话示例如下:
json { dialogue_id: 602, dialogue_url: https://www.healthtap.com/member/fg?page=/search/covid, dialogue_turns: [{speaker: Patient, utterance: Can coronavirus symptoms be mild for some people versus severe? For example, could it just involve being very fatigued, low grade fever for a few days and not the extreme symptoms? Or is it always a full blown cold and struggle to breathe?Can coronavirus symptoms be mild for some people versus severe? For example, could it just involve being very fatigued, low grade fever for a few days and not the extreme symptoms? Or is it always a full blown cold and struggle to breathe?}, {speaker: Doctor, utterance: In brief: Symptoms vary. Some may have no symptoms at all. Some can be life threatening. Would you like to video or text chat with me?}] }
数据字段
每个咨询包含以下内容:
- ID
- URL
- 患者医疗状况描述
- 对话
- 诊断和建议(可选,多为中文)
数据分割
原始数据没有进行数据分割。
数据集创建
数据来源
- 英语数据集: 来自icliniq.com、healthcaremagic.com、healthtap.com,所有版权属于这些网站。
- 中文数据集: 来自Haodf.com,所有版权属于Haodf.com。
附加信息
数据集创建者
- 标题: CovidDialog: Medical Dialogue Datasets about COVID-19
- 作者: Ju, Zeqian and Chakravorty, Subrato and He, Xuehai and Chen, Shu and Yang, Xingyi and Xie, Pengtao
- 年份: 2020
- 链接: GitHub
贡献
感谢@vrindaprabhu添加此数据集。




