MSCOCO|对象检测数据集|图像分割数据集
收藏数据集概述
数据集名称
- 名称: MSCOCO
- 别名: COCO
数据集特征
- 任务类型:
- 图像分割
- 目标检测
- 其他
- 具体任务:
- 实例分割
- 语义分割
- 全景分割
- 语言: 英语(单语种)
- 许可证: Creative Commons Attribution 4.0 License (cc-by-4.0)
- 数据来源: 原始数据
- 注释创建者: 众包
- 标签:
- 图像字幕
- 目标检测
- 关键点检测
- 东西分割
- 全景分割
数据集详细信息
- 图像数量: 330K(超过200K标记)
- 对象实例数量: 1.5 million
- 对象类别数量: 80
- 东西类别数量: 91
- 每张图像字幕数量: 5
- 含有关键点的人物数量: 250,000
数据集结构
- 数据实例:
- 2014年:
- 字幕数据集
- 实例数据集
- 人物关键点数据集
- 2017年:
- 字幕数据集
- 实例数据集
- 人物关键点数据集
- 2014年:
许可证信息
- 注释和网站: 属于COCO Consortium,根据Creative Commons Attribution 4.0 License授权。
- 图像: COCO Consortium不拥有图像版权,使用需遵守Flickr服务条款。
- 软件: 根据特定条件允许重分发和修改,需保留版权声明。
引用信息
bibtex @inproceedings{lin2014microsoft, title={Microsoft coco: Common objects in context}, author={Lin, Tsung-Yi and Maire, Michael and Belongie, Serge and Hays, James and Perona, Pietro and Ramanan, Deva and Doll{a}r, Piotr and Zitnick, C Lawrence}, booktitle={Computer Vision--ECCV 2014: 13th European Conference, Zurich, Switzerland, September 6-12, 2014, Proceedings, Part V 13}, pages={740--755}, year={2014}, organization={Springer} }
贡献者
- 创建者: COCO Consortium

- MSCOCO数据集首次发布,包含超过30万张图像,每张图像附有详细的标注信息,主要用于图像识别和语义分割任务。
- MSCOCO数据集在ImageNet大规模视觉识别挑战赛中首次应用,显著提升了图像识别和物体检测的性能。
- MSCOCO数据集扩展了其标注范围,增加了更多的语义和实例分割标注,进一步丰富了数据集的应用场景。
- MSCOCO数据集在自然语言处理领域得到广泛应用,特别是在图像描述生成和视觉问答任务中,成为基准数据集之一。
- MSCOCO数据集发布了新的版本,优化了标注质量和数据分布,继续推动计算机视觉和自然语言处理领域的研究进展。
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
GHCN
GHCN(Global Historical Climatology Network)是一个全球历史气候网络数据集,包含了全球各地气象站记录的每日气象数据,如温度、降水、风速等。该数据集用于研究气候变化和天气模式。
www.ncei.noaa.gov 收录
LogiQA
LogiQA 包含 8,678 个 QA 实例,涵盖多种类型的演绎推理。结果表明,最先进的神经模型的性能远远低于人类天花板。该数据集还可以作为在深度学习 NLP 设置下重新研究逻辑 AI 的基准。
OpenDataLab 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录