five

Adanato/FineVision5

收藏
Hugging Face2026-02-25 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/Adanato/FineVision5
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: LLaVA_Instruct_150K path: data/LLaVA_Instruct_150K-* - split: vqav2 path: data/vqav2-* - split: ocrvqa path: data/ocrvqa-* - split: captcha path: data/captcha-* - split: CoSyn_400k_chart path: data/CoSyn_400k_chart-* dataset_info: features: - name: images list: image - name: texts list: - name: user dtype: string - name: assistant dtype: string - name: source dtype: string - name: relevance_ratings list: int64 - name: relevance_min dtype: int64 - name: image_correspondence_ratings list: int64 - name: image_correspondence_min dtype: int64 - name: visual_dependency_ratings list: int64 - name: visual_dependency_min dtype: int64 - name: formatting_ratings list: int64 - name: formatting_min dtype: int64 splits: - name: LLaVA_Instruct_150K num_bytes: 76726976305 num_examples: 157710 - name: vqav2 num_bytes: 4295913718 num_examples: 82772 - name: ocrvqa num_bytes: 6148694690 num_examples: 165746 - name: captcha num_bytes: 1108385675 num_examples: 113062 - name: CoSyn_400k_chart num_bytes: 25619864651 num_examples: 116814 download_size: 113247581380 dataset_size: 113899835039 ---

配置项: - 配置名称:默认(default) 数据文件: - 拆分集:LLaVA_Instruct_150K 路径:data/LLaVA_Instruct_150K-* - 拆分集:vqav2 路径:data/vqav2-* - 拆分集:ocrvqa 路径:data/ocrvqa-* - 拆分集:captcha 路径:data/captcha-* - 拆分集:CoSyn_400k_chart 路径:data/CoSyn_400k_chart-* 数据集信息: 特征字段: - 字段名:images,类型为图像(image)列表 - 字段名:texts,类型为列表,列表元素包含: - 子字段名:user,数据类型:字符串(string) - 子字段名:assistant,数据类型:字符串(string) - 字段名:source,数据类型:字符串(string) - 字段名:relevance_ratings(相关性评分),类型为64位整数(int64)列表 - 字段名:relevance_min,数据类型:64位整数(int64) - 字段名:image_correspondence_ratings(图像对应评分),类型为64位整数(int64)列表 - 字段名:image_correspondence_min,数据类型:64位整数(int64) - 字段名:visual_dependency_ratings(视觉依赖评分),类型为64位整数(int64)列表 - 字段名:visual_dependency_min,数据类型:64位整数(int64) - 字段名:formatting_ratings(格式评分),类型为64位整数(int64)列表 - 字段名:formatting_min,数据类型:64位整数(int64) 拆分集详情: - 拆分集名称:LLaVA_Instruct_150K 总字节数:76726976305 样本数量:157710 - 拆分集名称:vqav2 总字节数:4295913718 样本数量:82772 - 拆分集名称:ocrvqa 总字节数:6148694690 样本数量:165746 - 拆分集名称:captcha 总字节数:1108385675 样本数量:113062 - 拆分集名称:CoSyn_400k_chart 总字节数:25619864651 样本数量:116814 下载总大小:113247581380 数据集总占用大小:113899835039
提供机构:
Adanato
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作