unum-cloud/ann-t2i-1m
收藏Hugging Face2023-04-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/unum-cloud/ann-t2i-1m
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由Yandex索引并由Se-ResNext-101模型生成的1M张图像的200维向量。数据集结构包括三个矩阵:base矩阵包含1M个向量用于构建索引,query矩阵包含100K个向量用于在索引中查找,truth矩阵包含每个查询的10倍结果。
该数据集包含由Yandex索引并由Se-ResNext-101模型生成的1M张图像的200维向量。数据集结构包括三个矩阵:base矩阵包含1M个向量用于构建索引,query矩阵包含100K个向量用于在索引中查找,truth矩阵包含每个查询的10倍结果。
提供机构:
unum-cloud
原始信息汇总
数据集概述
数据集名称
- 名称:Yandex Text-to-Image 1M Vectors Sample for Nearest Neighbors Search
数据集内容
- 包含1M图像的200维向量,由Se-ResNext-101模型生成。
数据集结构
- base:
base.1M.fbin,包含1M向量用于构建索引。 - query:
query.public.100K.fbin,包含100K向量用于在索引中查找。 - truth:
groundtruth.public.100K.ibin,为每个100K查询提供10x结果。
使用方法
- 安装Git LFS。
- 克隆数据集仓库:
git clone https://huggingface.co/datasets/unum-cloud/ann-t2i-1m。
数据集大小
- 大小范围:1M<n<10M
许可证
- 许可证:Apache-2.0



