five

yosubshin/walton-mmr1

收藏
Hugging Face2025-10-07 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/yosubshin/walton-mmr1
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个经过data-preproc包处理的视觉语言模型训练数据集,包含10000个示例。数据集使用Qwen/Qwen2.5-7B-Instruct模型和分词器,序列长度为16384。数据集特征包括:输入序列、注意力掩码、语言建模标签、图像对象、原始对话消息和处理元数据。

This is a vision-language model training dataset processed using the data-preproc package, containing 10000 examples. The dataset uses the Qwen/Qwen2.5-7B-Instruct model and tokenizer, with a sequence length of 16384. Dataset features include: tokenized input sequences, attention masks, language modeling labels, PIL Image objects, original conversation messages, and processing metadata.
提供机构:
yosubshin
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作