Adanato/FineVision5
收藏Hugging Face2026-02-25 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Adanato/FineVision5
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: LLaVA_Instruct_150K
path: data/LLaVA_Instruct_150K-*
- split: vqav2
path: data/vqav2-*
- split: ocrvqa
path: data/ocrvqa-*
- split: captcha
path: data/captcha-*
- split: CoSyn_400k_chart
path: data/CoSyn_400k_chart-*
dataset_info:
features:
- name: images
list: image
- name: texts
list:
- name: user
dtype: string
- name: assistant
dtype: string
- name: source
dtype: string
- name: relevance_ratings
list: int64
- name: relevance_min
dtype: int64
- name: image_correspondence_ratings
list: int64
- name: image_correspondence_min
dtype: int64
- name: visual_dependency_ratings
list: int64
- name: visual_dependency_min
dtype: int64
- name: formatting_ratings
list: int64
- name: formatting_min
dtype: int64
splits:
- name: LLaVA_Instruct_150K
num_bytes: 76726976305
num_examples: 157710
- name: vqav2
num_bytes: 4295913718
num_examples: 82772
- name: ocrvqa
num_bytes: 6148694690
num_examples: 165746
- name: captcha
num_bytes: 1108385675
num_examples: 113062
- name: CoSyn_400k_chart
num_bytes: 25619864651
num_examples: 116814
download_size: 113247581380
dataset_size: 113899835039
---
配置项:
- 配置名称:默认(default)
数据文件:
- 拆分集:LLaVA_Instruct_150K
路径:data/LLaVA_Instruct_150K-*
- 拆分集:vqav2
路径:data/vqav2-*
- 拆分集:ocrvqa
路径:data/ocrvqa-*
- 拆分集:captcha
路径:data/captcha-*
- 拆分集:CoSyn_400k_chart
路径:data/CoSyn_400k_chart-*
数据集信息:
特征字段:
- 字段名:images,类型为图像(image)列表
- 字段名:texts,类型为列表,列表元素包含:
- 子字段名:user,数据类型:字符串(string)
- 子字段名:assistant,数据类型:字符串(string)
- 字段名:source,数据类型:字符串(string)
- 字段名:relevance_ratings(相关性评分),类型为64位整数(int64)列表
- 字段名:relevance_min,数据类型:64位整数(int64)
- 字段名:image_correspondence_ratings(图像对应评分),类型为64位整数(int64)列表
- 字段名:image_correspondence_min,数据类型:64位整数(int64)
- 字段名:visual_dependency_ratings(视觉依赖评分),类型为64位整数(int64)列表
- 字段名:visual_dependency_min,数据类型:64位整数(int64)
- 字段名:formatting_ratings(格式评分),类型为64位整数(int64)列表
- 字段名:formatting_min,数据类型:64位整数(int64)
拆分集详情:
- 拆分集名称:LLaVA_Instruct_150K
总字节数:76726976305
样本数量:157710
- 拆分集名称:vqav2
总字节数:4295913718
样本数量:82772
- 拆分集名称:ocrvqa
总字节数:6148694690
样本数量:165746
- 拆分集名称:captcha
总字节数:1108385675
样本数量:113062
- 拆分集名称:CoSyn_400k_chart
总字节数:25619864651
样本数量:116814
下载总大小:113247581380
数据集总占用大小:113899835039
提供机构:
Adanato



