COCO|对象检测数据集|图像分割数据集
收藏数据集概述
数据集名称
- COCO (Common Objects in Context)
数据集用途
- 对象检测
- 语义分割
- 图像标注
- 关键点检测
- 全景分割
数据集特点
- 包含81个类别
- 提供多对象标注、分割掩码标注、图像标注、关键点检测和全景分割标注
数据集版本
- COCO 2017
数据集内容
- 约120,000训练图像,每张图像至少有5个标注
- 像素级语义分割
- 关键点信息
- 40,670测试图像
- 5,000验证图像
数据集下载
- 下载链接:COCO数据集
- 大小:超过24GB
数据集API
- 下载链接:COCO API
- 提供Matlab、Python、Lua API,用于加载、解析和可视化COCO数据集的标注

- COCO数据集首次发表,由微软研究院提出,旨在推动图像识别和物体检测领域的发展。
- COCO数据集首次应用于图像分割任务,展示了其在多任务学习中的潜力。
- COCO数据集成为国际计算机视觉竞赛(COCO Challenges)的官方数据集,吸引了全球研究者的参与。
- COCO数据集的版本更新,增加了更多的图像和标注,提升了数据集的多样性和复杂性。
- COCO数据集在自然语言处理(NLP)与计算机视觉(CV)的跨领域研究中得到广泛应用,推动了多模态学习的发展。
- 1Microsoft COCO: Common Objects in ContextMicrosoft Research · 2014年
- 2Deep Residual Learning for Image RecognitionMicrosoft Research · 2015年
- 3Focal Loss for Dense Object DetectionFacebook AI Research · 2017年
- 4Mask R-CNNFacebook AI Research · 2017年
- 5YOLOv3: An Incremental ImprovementUniversity of Washington · 2018年
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
中国30米分辨率土壤可蚀性因子数据集
该数据集为2018年中国30米分辨率土壤可蚀性因子(K)栅格数据,数据是利用中国1979-1994年的全国第二次土壤普查的成果数据进行计算;再利用径流小区观测数据修正计算结果;将修订结果利用反距离权重插值法插值生成栅格数据。特殊地类河湖库塘、冰川及永久积雪、裸岩土地类型K因子值强制赋值为0。如果用户采用的土地利用精度较高,建议重新对以下土地类型的K因子强制赋值为0:河湖库塘、冰川及永久积雪、裸岩。如果有K值为0,但不属于上述类型的,K因子可按如下原则:取邻近相同土地类型图斑的K值,或取与该图斑邻近且不等于0的所有图斑K值的平均值。
国家地球系统科学数据中心 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录