five

embedding-data/coco_captions_quintets

收藏
Hugging Face2022-08-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/embedding-data/coco_captions_quintets
下载链接
链接失效反馈
官方服务:
资源简介:
COCO是一个大规模的对象检测、分割和描述数据集。该数据集包含每张图片的五条描述,适用于句子相似性任务。数据集的结构为每个示例包含五个相似句子的列表,格式为字典。数据集的语言为英语,许可证为MIT。
提供机构:
embedding-data
原始信息汇总

数据集概述

数据集名称

  • 名称: coco_captions
  • 别名: 无

数据集描述

  • 摘要: COCO是一个大规模的对象检测、分割和字幕数据集。本仓库包含每张图片五个字幕,适用于句子相似度任务。
  • 任务支持: 用于训练Sentence Transformers模型,适用于语义搜索和句子相似度任务。
  • 语言: 英语

数据集结构

  • 数据实例格式: 每个数据实例包含五个相似的句子,格式为字典,键为"set",值为句子列表。
  • 数据集加载示例: 使用🤗 Datasets库加载数据集,数据集以DatasetDict格式存储,包含训练集。

数据集创建

  • 许可证: MIT
  • 贡献者: Tsung-Yi Lin, Genevieve Patterson, Matteo R., Yin Cui, Michael Maire, Serge Belongie, Lubomir Bourdev, Ross Girshick, James Hays, Pietro Perona, Deva Ramanan, Larry Zitnick, Piotr Dollár
  • 版权信息: 数据集注释及本网站属于COCO Consortium,根据Creative Commons Attribution 4.0 License授权。

使用注意事项

  • 数据集限制: 详细信息需进一步了解。
  • 社会影响与偏见: 详细信息需进一步了解。

附加信息

  • 引用信息: 详细信息需进一步了解。
  • 数据集维护者: 详细信息需进一步了解。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作