Kaichengalex/YFCC15M
收藏Hugging Face2024-10-22 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/Kaichengalex/YFCC15M
下载链接
链接失效反馈官方服务:
资源简介:
YFCC15M Recaption Dataset是通过DeCLIP过滤并使用RWKV-CLIP提出的多样化描述生成框架重新标注的数据集。文本部分是由CLIP tokenizer编码的长度为77的文本标记列表。该数据集包含图像和文本特征,主要用于训练视觉-语言表示学习模型。
The YFCC15M Dataset is filtered by DeCLIP and recaptioned utilizing the diverse description generation framework proposed in RWKV-CLIP. The text is a list of 77 text tokens encoded using the CLIP tokenizer.
提供机构:
Kaichengalex



