five

VisualWebInstruct

收藏
魔搭社区2025-11-05 更新2025-06-14 收录
下载链接:
https://modelscope.cn/datasets/TIGER-Lab/VisualWebInstruct
下载链接
链接失效反馈
官方服务:
资源简介:
dataset_info: features: - name: question dtype: string - name: answer dtype: string - name: question_images sequence: image - name: solution_images sequence: image - name: url dtype: string - name: idx dtype: int64 splits: - name: train num_bytes: 18740359983.565006 num_examples: 359777 download_size: 18809874167 dataset_size: 18740359983.565006 configs: - config_name: raw data_files: - split: train path: data/train_batch_*.parquet license: mit task_categories: - question-answering language: - en tags: - multimodal pretty_name: VisualWebInstruct size_categories: - 100K<n<1M ---

数据集信息: 数据特征: - 字段名称:问题(question),数据类型:字符串 - 字段名称:答案(answer),数据类型:字符串 - 字段名称:问题关联图像(question_images),数据类型:图像序列 - 字段名称:解题过程图像(solution_images),数据类型:图像序列 - 字段名称:来源链接(url),数据类型:字符串 - 字段名称:索引(idx),数据类型:64位整型 数据拆分: - 拆分名称:训练集(train),占用字节数:18740359983.565006,样本数量:359777 下载大小:18809874167 数据集占用大小:18740359983.565006 配置项: - 配置名称:原始配置(raw),数据文件: - 拆分:训练集(train),文件路径:data/train_batch_*.parquet 许可证:MIT许可证 任务类别: - 问答任务(question-answering) 语言: - 英语(en) 标签: - 多模态(multimodal) 数据集展示名称:可视化网页指令数据集(VisualWebInstruct) 样本规模区间:100K < 样本数 < 1M
提供机构:
maas
创建时间:
2025-02-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作