five

unum-cloud/ann-cc-3m

收藏
Hugging Face2026-04-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/unum-cloud/ann-cc-3m
下载链接
链接失效反馈
官方服务:
资源简介:
CC3M Image-Text Embeddings数据集包含多个文件,其中包括base64编码的图像文件、图像的标题文件、以及不同模型的图像和文本嵌入文件及其对应的USearch索引文件。这些文件用于存储和处理图像与文本的嵌入表示,以便进行进一步的分析和应用。

CC3M Image-Text Embeddings数据集包含多个文件,其中包括base64编码的图像文件、图像的标题文件、以及不同模型的图像和文本嵌入文件及其对应的USearch索引文件。这些文件用于存储和处理图像与文本的嵌入表示,以便进行进一步的分析和应用。
提供机构:
unum-cloud
原始信息汇总

CC3M Image-Text Embeddings 数据集概述

文件描述

  • images_part{1-3}.txt: 包含 base64 编码的图像的文本文件。
  • texts.txt: 包含图像描述的文本文件。
  • images.{model_name}.fbin: 包含 {model_name} 图像嵌入的二进制文件。
  • images.{model_name}.usearch: 包含序列化的 USearch 图像索引的二进制文件,该索引包含 images.{model_name}.fbin
  • texts.{model_name}.fbin: 包含 {model_name} 文本嵌入的二进制文件。
  • texts.{model_name}.usearch: 包含序列化的 USearch 文本索引的二进制文件,该索引包含 texts.{model_name}.fbin
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作