embedding-data/coco_captions_quintets
收藏Hugging Face2022-08-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/embedding-data/coco_captions_quintets
下载链接
链接失效反馈官方服务:
资源简介:
COCO是一个大规模的对象检测、分割和描述数据集。该数据集包含每张图片的五条描述,适用于句子相似性任务。数据集的结构为每个示例包含五个相似句子的列表,格式为字典。数据集的语言为英语,许可证为MIT。
提供机构:
embedding-data
原始信息汇总
数据集概述
数据集名称
- 名称: coco_captions
- 别名: 无
数据集描述
- 摘要: COCO是一个大规模的对象检测、分割和字幕数据集。本仓库包含每张图片五个字幕,适用于句子相似度任务。
- 任务支持: 用于训练Sentence Transformers模型,适用于语义搜索和句子相似度任务。
- 语言: 英语
数据集结构
- 数据实例格式: 每个数据实例包含五个相似的句子,格式为字典,键为"set",值为句子列表。
- 数据集加载示例: 使用🤗 Datasets库加载数据集,数据集以
DatasetDict格式存储,包含训练集。
数据集创建
- 许可证: MIT
- 贡献者: Tsung-Yi Lin, Genevieve Patterson, Matteo R., Yin Cui, Michael Maire, Serge Belongie, Lubomir Bourdev, Ross Girshick, James Hays, Pietro Perona, Deva Ramanan, Larry Zitnick, Piotr Dollár
- 版权信息: 数据集注释及本网站属于COCO Consortium,根据Creative Commons Attribution 4.0 License授权。
使用注意事项
- 数据集限制: 详细信息需进一步了解。
- 社会影响与偏见: 详细信息需进一步了解。
附加信息
- 引用信息: 详细信息需进一步了解。
- 数据集维护者: 详细信息需进一步了解。



