mehdidc/yfcc15m
收藏Hugging Face2024-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mehdidc/yfcc15m
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc
---
YFCC15m dataset from <https://github.com/openai/CLIP/blob/main/data/yfcc100m.md>.
The subset is obtained by filtering the original YFCC100m (yfcc100m_dataset.sql) using the photo ids from <https://github.com/openai/CLIP/blob/main/data/yfcc100m.md>.
The script to rebuild the data from the original YFCC100m is provided at [build_yfcc15m.py](build_yfcc15m.py).
提供机构:
mehdidc
原始信息汇总
YFCC15m 数据集
来源
- 数据集来源于 YFCC100m,通过筛选原始 YFCC100m 数据集(文件名为
yfcc100m_dataset.sql)中的照片ID获得。 - 筛选依据的照片ID来自 YFCC100m 数据集详情页。
重建脚本
- 提供了一个脚本
build_yfcc15m.py,用于从原始 YFCC100m 数据集重建 YFCC15m 数据集。



