five

Kaichengalex/YFCC15M

收藏
Hugging Face2024-10-22 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/Kaichengalex/YFCC15M
下载链接
链接失效反馈
官方服务:
资源简介:
YFCC15M Recaption Dataset是通过DeCLIP过滤并使用RWKV-CLIP提出的多样化描述生成框架重新标注的数据集。文本部分是由CLIP tokenizer编码的长度为77的文本标记列表。该数据集包含图像和文本特征,主要用于训练视觉-语言表示学习模型。

The YFCC15M Dataset is filtered by DeCLIP and recaptioned utilizing the diverse description generation framework proposed in RWKV-CLIP. The text is a list of 77 text tokens encoded using the CLIP tokenizer.
提供机构:
Kaichengalex
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作