five

habedi/multi-vector-search-datasets

收藏
Hugging Face2025-07-09 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/habedi/multi-vector-search-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
多向量搜索数据集包括Stack Exchange数据集和Flickr8k数据集。Stack Exchange数据集包含了来自计算机科学、数据科学和政治科学领域的帖子,每个帖子有唯一的ID、标题、正文、标签以及对应的三个768维向量。Flickr8k数据集则包含了图片及其五个标题的描述,每个标题和图片都有一个对应的768维向量。这些数据集被用于测试和基准化多向量近似最近邻搜索算法及其实现。

The Multi-Vector Search Datasets include Stack Exchange datasets and Flickr8k datasets. The Stack Exchange datasets contain posts from the fields of Computer Science, Data Science, and Political Science, with each post having a unique ID, title, body, tags, and three corresponding 768-dimensional vectors. The Flickr8k dataset includes images and their five caption descriptions, with each caption and image having a corresponding 768-dimensional vector. These datasets are used for testing and benchmarking multi-vector approximate nearest neighbor search algorithms and their implementations.
提供机构:
habedi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作