five

evendrow/INQUIRE-Rerank

收藏
Hugging Face2024-06-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/evendrow/INQUIRE-Rerank
下载链接
链接失效反馈
官方服务:
资源简介:
INQUIRE-Rerank数据集是一个文本到图像检索基准,旨在挑战多模态模型处理关于自然世界的专家级查询。该数据集模拟科学家在处理大规模图像集合时面临的真实世界图像检索和分析问题。数据集包含多个特征,如图像、查询、相关性评分、CLIP评分、inat24图像ID、inat24文件名、超类别、类别、标志性组、inat24类别ID、inat24类别名称、纬度、经度、位置不确定性、日期、许可证和权利持有者。数据集的分割为训练集,包含16100个样本,总大小为1633954421字节。

The INQUIRE-Rerank dataset is a text-to-image retrieval benchmark designed to challenge multimodal models with expert-level queries about the natural world. This dataset aims to emulate real-world image retrieval and analysis problems faced by scientists working with large-scale image collections. The dataset includes features such as image, query, relevance score, CLIP score, inat24 image ID, inat24 file name, supercategory, category, iconic group, inat24 category ID, inat24 category name, latitude, longitude, location uncertainty, date, license, and rights holder. The dataset is split into a training set containing 16100 samples, with a total size of 1633954421 bytes.
提供机构:
evendrow
原始信息汇总

数据集概述

数据集信息

  • 许可: cc-by-nc-4.0
  • 特征:
    • image: 图像类型
    • query: 字符串类型
    • relevant: 整数类型 (int64)
    • clip_score: 浮点数类型 (float64)
    • inat24_image_id: 整数类型 (int64)
    • inat24_file_name: 字符串类型
    • supercategory: 字符串类型
    • category: 字符串类型
    • iconic_group: 字符串类型
    • inat24_category_id: 整数类型 (int64)
    • inat24_category_name: 字符串类型
    • latitude: 浮点数类型 (float64)
    • longitude: 浮点数类型 (float64)
    • location_uncertainty: 浮点数类型 (float64)
    • date: 字符串类型
    • license: 字符串类型
    • rights_holder: 字符串类型

数据集划分

  • 训练集:
    • 大小: 1633954421 字节
    • 示例数量: 16100

数据集大小

  • 下载大小: 1507625576 字节
  • 数据集大小: 1633954421 字节

配置

  • 默认配置:
    • 数据文件:
      • 划分: 训练
      • 路径: data/train-*

大小分类

  • 范围: 10K<n<100K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作