five

oumi-ai/s1-vis-mid-resize

收藏
Hugging Face2025-07-09 更新2025-08-09 收录
下载链接:
https://hf-mirror.com/datasets/oumi-ai/s1-vis-mid-resize
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个保留了原始数据集结构的视觉语言数据集,通过令牌长度和图像质量进行了过滤,包含812个示例。该数据集使用data-preproc包进行处理,用于视觉语言模型的训练。数据集的特征包括令牌化的输入序列、序列的注意力掩码、语言建模的标签、PIL图像对象、原始对话消息和处理元数据。

This dataset preserves the original structure of the dataset, filtered by token length and image quality, containing 812 examples. The dataset was processed using the data-preproc package for vision-language model training. Dataset features include tokenized input sequences, attention masks for the sequences, labels for language modeling, PIL Image objects, original conversation messages, and processing metadata.
提供机构:
oumi-ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作