ApolloCorpora 多语言医疗数据集
收藏超神经2024-03-22 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/30285
下载链接
链接失效反馈官方服务:
资源简介:
ApolloCorpora 是深圳市大数据研究院和香港中文大学的研究团队联合构建的一个多语言医疗数据集。该数据集涵盖了全球 61 亿人口使用的六种主要语言,包括英语、中文、印地语、西班牙语、法语和阿拉伯语。
ApolloCorpora is a multilingual medical dataset jointly constructed by the research teams from Shenzhen Institute of Big Data and The Chinese University of Hong Kong. This dataset covers six major languages used by 6.1 billion people worldwide, including English, Chinese, Hindi, Spanish, French, and Arabic.
创建时间:
2024-03-21
搜集汇总
数据集介绍

背景与挑战
背景概述
ApolloCorpora是由深圳市大数据研究院与香港中文大学合作创建的多语言医疗数据集,覆盖英语、中文、印地语、西班牙语、法语和阿拉伯语六种语言。该数据集整合了书籍、临床指南、论文等多种来源的医疗信息,并转换为问答对形式,强调本地化特征如症状诊断和药物名称,为开发与评估多语言医疗AI模型提供基础。
以上内容由遇见数据集搜集并总结生成



