有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
default
)
train
): data/train-*
test
): data/test-*
image_id
: 图像的唯一标识符,类型为字符串。image
: 图像数据,类型为图像。label_cat_dog
: 图像标签,表示是猫还是狗,类型为字符串。label_breed
: 图像标签,表示猫或狗的品种,包含37种猫和狗的品种,类型为字符串。caption_enriched
: 图像的丰富描述,类型为字符串。label_bbox_enriched
: 图像的丰富标签,包含边界框坐标、置信度和标签,类型为列表。
bbox
: 边界框坐标,类型为整数序列。label
: 边界框标签,类型为字符串。issues
: 图像质量问题,类型为列表。
confidence
: 置信度,类型为浮点数。description
: 描述,类型为空。issue_type
: 问题类型,类型为字符串。train
)
test
)
DroneVehicle 大规模无人机航拍车辆检测数据集
这个数据集是天津大学的研究团队在进行无人机航拍图像的车辆检测和计数研究过程中收集和标注的。研究团队于 2020 年发布,相关论文成果为「Drone-based RGB-Infrared Cross-Modality Vehicle Detection via Uncertainty-Aware Learning」。
超神经 收录
LendingClub Loan Data
Loan & Rejects (2007 to 2019Q3)
kaggle 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录