five

C_plan_train_shard00_meta

收藏
Hugging Face2026-03-24 更新2026-03-25 收录
下载链接:
https://huggingface.co/datasets/Lululzz/C_plan_train_shard00_meta
下载链接
链接失效反馈
官方服务:
资源简介:
Causal_Plan 是一个用于微调视觉语言模型(VLMs)的多模态数据集。该数据集将第一人称视角视频(来自 Ego4D 和 EPIC-Kitchens)处理为结构化因果计划,生成了涵盖24种任务类型的462,000个多模态问答对,并导出用于 Qwen3-VL-8B-Instruct 的 LoRA SFT。数据集包含来自两个主要语料库的原始视频数据:EPIC-Kitchens(厨房活动视频)和 Ego4D(多样化第一人称活动)。数据处理采用四层架构:1)原始视频数据;2)因果计划生成(包括两阶段和三阶段处理流程);3)问答对生成;4)SFT导出。数据集总大小约894GB,包含约171万文件。问答对涵盖六大类24种任务类型,包括目标识别、步骤理解、精细推理、条件分析、序列推理和鲁棒性测试。数据集提供了多种证据类型,包括关键帧图像、视频片段和场景图像。数据以JSONL格式存储,并支持导出为LlamaFactory和ms-swift格式用于监督微调。
创建时间:
2026-03-18
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作