CapsFusion-120M 多模态图文数据集
收藏超神经2024-06-07 更新2024-06-29 收录
下载链接:
https://hyper.ai/cn/datasets/32309
下载链接
链接失效反馈资源简介:
该数据集是清华大学和 BAAI 于 2024 年推出的多模态图文数据集。论文成果 「CapsFusion: Rethinking Image-Text Data at Scale」已被 CVPR 2024 收录。
This multimodal image-text dataset was released in 2024 by Tsinghua University and BAAI. The corresponding research paper titled "CapsFusion: Rethinking Image-Text Data at Scale" has been accepted by CVPR 2024.
创建时间:
2024-06-06
AI搜集汇总
数据集介绍

背景与挑战
背景概述
CapsFusion-120M是由清华大学和BAAI于2024年发布的多模态图文数据集,其相关论文被CVPR 2024收录。该数据集包含约120M条目,每个条目提供图片网址及三种标题(来自LAION-2B的原始文本、LAION-COCO的合成字幕和研究团队的优化标题),旨在作为大规模多模态预训练的高质量资源,便于比较分析和提升图像文本数据质量。
以上内容由AI搜集并总结生成



