five

Audio-Video-Engineering-Agentic-Tasks-1M

收藏
Hugging Face2026-03-13 更新2026-04-23 收录
下载链接:
https://huggingface.co/datasets/yatin-superintelligence/Audio-Video-Engineering-Agentic-Tasks-1M
下载链接
链接失效反馈
官方服务:
资源简介:
Audio/Video Engineering Agentic Tasks (1M) 是一个高度专业化的数据集,包含1,029,459个上下文故障排除提示和执行命令,专为深度媒体制作场景设计。该数据集不同于模拟干净理论指令的标准数据集,而是捕捉了专业音频工程师、作曲家和视频编辑在会话中的混乱、高度详细和对话式现实场景。 数据集规模:包含1,029,459行数据,约156,015,488个任务令牌,涵盖25种专注于音频工程、音乐创作和视频后期制作的专业原型。数据以分块Parquet格式存储(Zstandard压缩)。 核心特点:数据集采用对话式、诊断性、多步骤的操作语气(平均每条指令127.75字),专注于"会话中危机"场景,要求AI代理能够解析领域特定的复杂语言,并推导出解决时间线问题的精确操作序列。 数据结构包含五个字段:batch_id(生成标记)、index(矩阵索引)、professional(职业原型)、group(宏观类别)和user_prompt(原始任务序列)。 应用场景:主要用于训练多模态AI代理在数字音频工作站(DAW)和非线性编辑(NLE)环境中的操作能力,包括音乐制作、声音设计、视频编辑和色彩分级等专业领域。数据集采用MIT许可证发布,适用于商业、学术和个人模型训练。
创建时间:
2026-03-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作