VintixDatasetII
收藏Vintix II 数据集概述
数据集基本信息
- 数据集名称: Vintix II 训练数据集
- 相关模型: Vintix II: Decision Pre-Trained Transformer
- 数据集地址: https://huggingface.co/datasets/artfawl/VintixDatasetII
- 模型地址: https://huggingface.co/dunnolab/VintixII
- 论文地址: https://arxiv.org/abs/2604.05112
- 相关研究: https://arxiv.org/abs/2501.19400
- 许可协议: CC BY-SA 4.0 License
数据集内容与规模
- 数据规模: 包含超过 7 亿条转移数据。
- 任务范围: 涵盖 209 个训练任务。
- 领域覆盖: 横跨 10 个不同领域。
- 数据格式: 由多个
.h5文件组成,每个文件对应特定环境中的单条轨迹。
数据结构
每个轨迹文件被划分为若干组(每组通常为 10,000 步,轨迹最后一组可能步数较少),每组包含以下键:
proprio_observation: 观测序列 (np.float32)action: 在环境中采取的动作序列 (np.float32)reward: 每个动作后获得的奖励序列 (np.float32)step_num: 每个回合内的步数序列 (np.int32)demonstrator_action: 当前观测对应的演示者动作序列 (np.float32)
获取方式
-
从 Hugging Face 下载: shell pip3 install huggingface_hub
python from huggingface_hub import snapshot_download snapshot_download(repo_id="artfawl/VintixDatasetII", repo_type="dataset", local_dir="/path/to/VintixDatasetII")
-
从公共 S3 存储桶下载: shell curl -L -o VintixII.zip https://tinyurl.com/VintixDataset2 unzip VintixII.zip
相关资源
- 训练代码仓库: https://github.com/dunnolab/vintix-II.git
- 环境配置说明: 位于
train/docker/README.md - 领域环境配置: 位于
domains目录 - 推理示例: 位于
inference目录
引用
如需引用本工作,请使用以下 BibTeX 条目: bibtex @article{polubarov2026vintixiidecisionpretrained, author={Andrei Polubarov and Lyubaykin Nikita and Alexander Derevyagin and Artyom Grishin and Igor Saprygin and Aleksandr Serkov and Mark Averchenko and Daniil Tikhonov and Maksim Zhdanov and Alexander Nikulin and Ilya Zisman and Albina Klepach and Alexey Zemtsov and Vladislav Kurenkov}, title={Vintix II: Decision Pre-Trained Transformer is a Scalable In-Context Reinforcement Learner}, journal={arXiv}, volume={2604.05112}, year={2026}, }




