five

VincentNi/EmbodiedVideoRL_baseline_put_object_cabinet

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/VincentNi/EmbodiedVideoRL_baseline_put_object_cabinet
下载链接
链接失效反馈
官方服务:
资源简介:
第一轮(预NFT)Wan2.2 TI2V基线rollouts:put_object_cabinet任务。这些视频是在进行任何NFT微调之前生成的(NFT步骤0),用于作为参考分布来衡量NFT改进的效果。数据集包含10个场景,每个场景有16个rollout,总共160个视频。视频的生成配置包括模型(Wan2.2-TI2V-5B + merged_vidar_lora.pt)、分辨率(640 x 736)、帧率(121帧,24fps,约5.04秒)、采样方法(SDE,eta=1.0,50步,shift=5.0,guide_scale=5.0)等详细信息。

First-round (pre-NFT) Wan2.2 TI2V baseline rollouts: put_object_cabinet task. Baseline video rollouts generated before any NFT fine-tuning (NFT step 0) for the RoboTwin `put_object_cabinet` task. Used as a reference distribution for measuring NFT improvement. The dataset includes 10 scenes, with 16 rollouts per scene, totaling 160 videos. The generation configuration includes model (Wan2.2-TI2V-5B + merged_vidar_lora.pt), resolution (640 x 736), frame rate (121 frames, 24fps, ~5.04s), sampling method (SDE, eta=1.0, 50 steps, shift=5.0, guide_scale=5.0), and other details.
提供机构:
VincentNi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作