five

LAION-5B

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/LAION-5B
下载链接
链接失效反馈
官方服务:
资源简介:
LAION 5B 是一个用于研究目的的大规模图文数据集。由58.5亿个CLIP过滤的图像-文本对组成,其中包含23.2亿的英语,22.6亿的样本来自100多种其他语言,及12.7亿的未知样本。此外,发布方提供了几个最近邻索引、用于探索和子集创建的改进Web界面以及水印和NSFW的检测分数。 OpenDataLab 网站提供了处理好的parquet文件,研究者可以下载,根据这份元数据下载对应的图片文件。 现在,我们也开源了LAION-5B图片下载代码,github开源地址如下:https://github.com/opendatalab/laion5b-downloader
提供机构:
OpenDataLab
创建时间:
2022-10-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作