prthm29/gujarati_ocr_sharegpt
收藏Hugging Face2026-04-06 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/prthm29/gujarati_ocr_sharegpt
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file_name
dtype: string
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: images
list: image
splits:
- name: train
num_bytes: 2837988095
num_examples: 82563
- name: val
num_bytes: 606067879
num_examples: 17643
- name: test
num_bytes: 566850203
num_examples: 16490
download_size: 4007059138
dataset_size: 4010906177
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: val
path: data/val-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 名称:文件名(file_name),数据类型:字符串
- 名称:对话消息列表(messages),列表结构:
- 名称:角色(role),数据类型:字符串
- 名称:内容(content),数据类型:字符串
- 名称:图像列表(images),元素类型:图像
数据拆分:
- 拆分名称:训练集(train),字节数:2837988095,样本数量:82563
- 拆分名称:验证集(val),字节数:606067879,样本数量:17643
- 拆分名称:测试集(test),字节数:566850203,样本数量:16490
下载总大小:4007059138
数据集总大小:4010906177
配置项:
- 配置名称:默认(default),数据文件配置:
- 训练集对应数据路径:data/train-*
- 验证集对应数据路径:data/val-*
- 测试集对应数据路径:data/test-*
提供机构:
prthm29



