five

VisualWebInstruct-Raw

收藏
魔搭社区2025-05-22 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/TIGER-Lab/VisualWebInstruct-Raw
下载链接
链接失效反馈
官方服务:
资源简介:
dataset_info: features: - name: question dtype: string - name: answer dtype: string - name: question_images sequence: image - name: solution_images sequence: image - name: url dtype: string - name: idx dtype: int64 splits: - name: train num_bytes: 18740359983.565006 num_examples: 359777 download_size: 18809874167 dataset_size: 18740359983.565006 configs: - config_name: raw data_files: - split: train path: data/train_batch_*.parquet license: mit task_categories: - question-answering language: - en tags: - multimodal pretty_name: VisualWebInstruct size_categories: - 100K<n<1M ---

数据集信息: 特征: - 字段名:问题(question),数据类型:字符串(string) - 字段名:答案(answer),数据类型:字符串(string) - 字段名:问题配图(question_images),数据类型:图像序列(sequence: image) - 字段名:解题配图(solution_images),数据类型:图像序列(sequence: image) - 字段名:来源链接(url),数据类型:字符串(string) - 字段名:索引(idx),数据类型:64位整型(int64) 数据集划分: - 划分名称:训练集(train),占用字节数:18740359983.565006,样本数量:359777 下载大小:18809874167 数据集总占用字节数:18740359983.565006 配置项: - 配置名称:原始(raw),数据文件: - 数据集划分:训练集(train),文件路径:data/train_batch_*.parquet 许可证:MIT(mit)协议 任务类别: - 问答(question-answering) 语言: - 英语(en) 标签: - 多模态(multimodal) 展示名称:可视化网页指令(VisualWebInstruct) 样本规模分类: - 100K<n<1M(10万<n<100万) ---
提供机构:
maas
创建时间:
2025-02-06
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作