toilaluan/good_datasets
收藏Hugging Face2026-03-21 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/toilaluan/good_datasets
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: molmo2_multi_imageqa
features:
- name: images
list:
image:
decode: false
- name: texts
list:
- name: user
dtype: string
- name: assistant
dtype: string
splits:
- name: train
num_bytes: 5436964783
num_examples: 16204
download_size: 5437330977
dataset_size: 5436964783
- config_name: molmo2_multi_images
features:
- name: images
list: image
- name: texts
list:
- name: user
dtype: string
- name: assistant
dtype: string
splits:
- name: train
num_bytes: 83219043
num_examples: 26
- name: validation
num_bytes: 109658300
num_examples: 51
download_size: 192891927
dataset_size: 192877343
configs:
- config_name: molmo2_multi_imageqa
data_files:
- split: train
path: molmo2_multi_imageqa/train-*
- config_name: molmo2_multi_images
data_files:
- split: train
path: molmo2_multi_images/train-*
- split: validation
path: molmo2_multi_images/validation-*
---
数据集信息:
- 配置名称:molmo2_multi_imageqa
特征:
- 字段名:images,列表元素类型为图像,解码设置为关闭
- 字段名:texts,列表包含两个子项:分别为user(数据类型:字符串)和assistant(数据类型:字符串)
数据划分:
- 划分名称:训练集,字节数:5436964783,样本数量:16204
下载大小:5437330977,数据集总占用字节数:5436964783
- 配置名称:molmo2_multi_images
特征:
- 字段名:images,列表元素类型为图像
- 字段名:texts,列表包含两个子项:分别为user(数据类型:字符串)和assistant(数据类型:字符串)
数据划分:
- 划分名称:训练集,字节数:83219043,样本数量:26
- 划分名称:验证集,字节数:109658300,样本数量:51
下载大小:192891927,数据集总占用字节数:192877343
配置项:
- 配置名称:molmo2_multi_imageqa,数据文件配置:
- 数据划分:训练集,文件路径:molmo2_multi_imageqa/train-*
- 配置名称:molmo2_multi_images,数据文件配置:
- 数据划分:训练集,文件路径:molmo2_multi_images/train-*
- 数据划分:验证集,文件路径:molmo2_multi_images/validation-*
提供机构:
toilaluan



