HuggingFaceM4/COCO
收藏数据集卡片 for [数据集名称]
数据集描述
数据集概述
MS COCO 是一个大规模的对象检测、分割和字幕数据集。COCO 具有以下特点:对象分割、上下文中的识别、超像素东西分割、330K 张图像(>200K 标注)、150 万个对象实例、80 个对象类别、91 个东西类别、每张图像 5 个字幕、25 万个人带有关键点。
目前只有 2014 子集(带有 Karpathy 标注和分割),但欢迎贡献 2017 子集的 COCO!
支持的任务和排行榜
[更多信息需要]
语言
[更多信息需要]
数据集结构
数据实例
每个实例具有以下结构: json { image: <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x480 at 0x7F69C1BA8550>, filepath: COCO_val2014_000000522418.jpg, sentids: [681330, 686718, 688839, 693159, 693204], filename: COCO_val2014_000000522418.jpg, imgid: 1, split: restval, sentences: { tokens: [a, woman, wearing, a, net, on, her, head, cutting, a, cake], raw: A woman wearing a net on her head cutting a cake. , imgid: 1, sentid: 681330 }, cocoid: 522418 }
数据字段
[更多信息需要]
数据分割
[更多信息需要]
数据集创建
策划理由
[更多信息需要]
源数据
初始数据收集和规范化
[更多信息需要]
源语言生产者是谁?
[更多信息需要]
标注
标注过程
[更多信息需要]
标注者是谁?
[更多信息需要]
个人和敏感信息
[更多信息需要]
使用数据集的注意事项
数据集的社会影响
[更多信息需要]
偏见的讨论
[更多信息需要]
其他已知限制
[更多信息需要]
附加信息
数据集策划者
[更多信息需要]
许可信息
[更多信息需要]
引用信息
[更多信息需要]
贡献
感谢 @VictorSanh 添加此数据集。




