C_plan_train_shard00_meta

Hugging Face2026-03-24 更新2026-03-25 收录

下载链接：

https://huggingface.co/datasets/Lululzz/C_plan_train_shard00_meta

下载链接

链接失效反馈

官方服务：

资源简介：

Causal_Plan 是一个用于微调视觉语言模型（VLMs）的多模态数据集。该数据集将第一人称视角视频（来自 Ego4D 和 EPIC-Kitchens）处理为结构化因果计划，生成了涵盖24种任务类型的462,000个多模态问答对，并导出用于 Qwen3-VL-8B-Instruct 的 LoRA SFT。数据集包含来自两个主要语料库的原始视频数据：EPIC-Kitchens（厨房活动视频）和 Ego4D（多样化第一人称活动）。数据处理采用四层架构：1)原始视频数据；2)因果计划生成（包括两阶段和三阶段处理流程）；3)问答对生成；4)SFT导出。数据集总大小约894GB，包含约171万文件。问答对涵盖六大类24种任务类型，包括目标识别、步骤理解、精细推理、条件分析、序列推理和鲁棒性测试。数据集提供了多种证据类型，包括关键帧图像、视频片段和场景图像。数据以JSONL格式存储，并支持导出为LlamaFactory和ms-swift格式用于监督微调。

创建时间：

2026-03-18

5,000+

优质数据集

54 个

任务类型

进入经典数据集