mixedbread-ai/public_ohr_v2_finance
收藏Hugging Face2025-04-30 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/mixedbread-ai/public_ohr_v2_finance
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: corpus
features:
- name: corpus-id
dtype: string
- name: image
dtype: image
splits:
- name: train
num_bytes: 925219486.375
num_examples: 2133
download_size: 837149710
dataset_size: 925219486.375
- config_name: default
features:
- name: query-id
dtype: string
- name: corpus-id
dtype: string
- name: score
dtype: int64
splits:
- name: train
num_bytes: 115625
num_examples: 1446
download_size: 60507
dataset_size: 115625
- config_name: queries
features:
- name: query-id
dtype: string
- name: query
dtype: string
splits:
- name: train
num_bytes: 218306
num_examples: 1367
download_size: 121759
dataset_size: 218306
configs:
- config_name: corpus
data_files:
- split: train
path: corpus/train-*
- config_name: default
data_files:
- split: train
path: data/train-*
- config_name: queries
data_files:
- split: train
path: queries/train-*
---
数据集信息:
- 配置名称:corpus
特征项:
- 名称:corpus-id(语料库ID),数据类型:字符串
- 名称:image(图像),数据类型:image(图像)
数据集划分:
- 名称:train(训练集),字节数:925219486.375,样本数:2133
下载大小:837149710,数据集总大小:925219486.375
- 配置名称:default
特征项:
- 名称:query-id(查询ID),数据类型:字符串
- 名称:corpus-id(语料库ID),数据类型:字符串
- 名称:score,数据类型:int64(64位整数)
数据集划分:
- 名称:train(训练集),字节数:115625,样本数:1446
下载大小:60507,数据集总大小:115625
- 配置名称:queries
特征项:
- 名称:query-id(查询ID),数据类型:字符串
- 名称:query(查询文本),数据类型:字符串
数据集划分:
- 名称:train(训练集),字节数:218306,样本数:1367
下载大小:121759,数据集总大小:218306
配置项:
- 配置名称:corpus,数据文件:
- 划分:train(训练集),路径:corpus/train-*
- 配置名称:default,数据文件:
- 划分:train(训练集),路径:data/train-*
- 配置名称:queries,数据文件:
- 划分:train(训练集),路径:queries/train-*
提供机构:
mixedbread-ai



