Detsutut/medmcqa-ita|医学教育数据集|问答系统数据集
收藏数据集概述
数据集名称
MedMCQA-ITA
数据集描述
MedMCQA-ITA 是一个自动翻译的意大利语版本的 Multiple-Choice Question Answering (MCQA) 数据集,旨在解决实际医学入学考试问题。
数据集特征
- id: 字符串类型
- question: 字符串类型
- opa: 字符串类型
- opb: 字符串类型
- opc: 字符串类型
- opd: 字符串类型
- cop: 分类标签,包含选项 a, b, c, d
- choice_type: 字符串类型
- exp: 字符串类型
- subject_name: 字符串类型
- topic_name: 字符串类型
数据集分割
- test: 6150个样本,占用1510301字节
- validation: 4183个样本,占用2469102字节
- train: 182822个样本,占用143781256字节
数据集大小
- 下载大小: 94116148字节
- 数据集大小: 147760659字节
任务类别
- question-answering
语言
- 意大利语
标签
- 医学
大小类别
- 100K<n<1M

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
CCPD
CCPD是一个大型的、多样化的、经过仔细标注的中国城市车牌开源数据集。CCPD数据集主要分为CCPD2019数据集和CCPD2020(CCPD-Green)数据集。CCPD2019数据集车牌类型仅有普通车牌(蓝色车牌),CCPD2020数据集车牌类型仅有新能源车牌(绿色车牌)。在CCPD数据集中,每张图片仅包含一张车牌,车牌的车牌省份主要为皖。CCPD中的每幅图像都包含大量的标注信息,但是CCPD数据集没有专门的标注文件,每张图像的文件名就是该图像对应的数据标注。
github 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录
LendingClub Loan Data
Loan & Rejects (2007 to 2019Q3)
kaggle 收录
UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录