DataDepictQA|图像质量评估数据集|多模态数据数据集
收藏DataDepictQA 数据集概述
数据集信息
- 许可证:Apache-2.0
- 任务类别:图像到文本
- 语言:英语
- 标签:多模态图像质量评估
- 数据集名称:DataDepictQA
- 数据集大小:100K<n<1M
数据集版本
-
DepictQA-Wild (DepictQA-v2)
-
DepictQA-v1
数据集构建
- 源代码:数据集构建代码
数据集构建详细步骤
-
KADIS700K
-
BAPPS
- 从这里下载BAPPS数据集(2AFC Train set和2AFC Val set)。
- 将下载的图像放置在
DataDepictQA/BAPPS
目录下。 - 下载的图像为256 x 256的补丁,从原始的64 x 64补丁调整大小。调整大小不影响比较结果,但影响详细推理任务,因为引入了额外的像素化失真。因此,我们将这些图像调整回原始的64 x 64分辨率。
- 运行
resize_bapps.py
脚本。
-
PIPAL
- 从这里下载PIPAL数据集(train set)。
- 将下载的图像放置在
DataDepictQA/PIPAL
目录下。
-
KADID10K
- 从这里下载KADID10K数据集。
- 将下载的图像放置在
DataDepictQA/KADID10K
目录下。
-
DetailDescriptionLAMM
- 从这里下载LAMM详细描述数据集(coco_images)。
- 将下载的图像放置在
DataDepictQA/DetailDescriptionLAMM
目录下。

FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国车牌识别数据集(7类,33万张)
这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。
魔搭社区 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
Cultural Dimensions Dataset
该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。
geerthofstede.com 收录