unum-cloud/ann-cc-3m
收藏Hugging Face2026-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/unum-cloud/ann-cc-3m
下载链接
链接失效反馈官方服务:
资源简介:
CC3M Image-Text Embeddings数据集包含多个文件,其中包括base64编码的图像文件、图像的标题文件、以及不同模型的图像和文本嵌入文件及其对应的USearch索引文件。这些文件用于存储和处理图像与文本的嵌入表示,以便进行进一步的分析和应用。
CC3M Image-Text Embeddings数据集包含多个文件,其中包括base64编码的图像文件、图像的标题文件、以及不同模型的图像和文本嵌入文件及其对应的USearch索引文件。这些文件用于存储和处理图像与文本的嵌入表示,以便进行进一步的分析和应用。
提供机构:
unum-cloud
原始信息汇总
CC3M Image-Text Embeddings 数据集概述
文件描述
images_part{1-3}.txt: 包含 base64 编码的图像的文本文件。texts.txt: 包含图像描述的文本文件。images.{model_name}.fbin: 包含 {model_name} 图像嵌入的二进制文件。images.{model_name}.usearch: 包含序列化的 USearch 图像索引的二进制文件,该索引包含images.{model_name}.fbin。texts.{model_name}.fbin: 包含 {model_name} 文本嵌入的二进制文件。texts.{model_name}.usearch: 包含序列化的 USearch 文本索引的二进制文件,该索引包含texts.{model_name}.fbin。



