five

LAION COCO

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/LAION_COCO
下载链接
链接失效反馈
官方服务:
资源简介:
Laion-coco是世界上最大的600M数据集,为公开可用的网络图像生成了高质量的字幕 Laion5B具有50亿自然字幕。它们提供了很多信息,但是合成字幕可以补充它们吗? 为了回答这个问题,我们使用现有的,公开可用的模型的组合,以MS COCO的风格为图像生成高质量的字幕。 我们使用BLIP L/14和2个剪辑版本 (L/14和RN50x64) 的合奏为来自英语Laion-5B子集的600M图像加上了字幕。
提供机构:
OpenDataLab
创建时间:
2023-10-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
LAION COCO是一个包含6亿张图像的大规模数据集,通过BLIP和CLIP模型为来自LAION-5B子集的图像生成了MS COCO风格的高质量合成字幕,旨在补充自然字幕的不足。该数据集由LAION于2022年9月15日发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作