Motion Creative Strategy Bootcamp — Corpus
收藏github2026-05-07 更新2026-05-09 收录
下载链接:
https://github.com/Motion-Creative/bootcamp
下载链接
链接失效反馈官方服务:
资源简介:
13K营销人员刚刚完成了为期7周的创意策略训练营。现在您的代理也可以参加。完整的训练营——每节周二课程、每节周四辅导课程——被提取为结构化markdown,供任何读取文件的代理使用。
13,000 marketers have just completed a 7-week creative strategy bootcamp. Your AI Agent can now also participate in this training. The complete bootcamp, including all Tuesday lecture sessions and Thursday coaching sessions, has been extracted into structured Markdown format for use by any AI Agent that accesses this document.
创建时间:
2026-05-07
原始信息汇总
Motion Creative Strategy Bootcamp — 数据集概述
该数据集是一个完整的创意策略训练营内容语料库,包含13周课程的结构化内容,专为AI代理(如Claude、Cursor等)读取和处理而设计。
数据集基本信息
- 名称:Motion Creative Strategy Bootcamp Corpus
- 地址:https://github.com/Motion-Creative/bootcamp
- 规模:约330 KB(约80K tokens的课程内容层),每节课参考文件25–100K tokens
- 覆盖范围:13个课程会话(7周内容,来自8周课程体系中的前7周)
数据集结构
目录组织
bootcamp/ ├── index.md ├── week-01/ ... week-07/
每个课程会话包含两种文件
| 文件类型 | 文件名格式 | 内容说明 | 使用建议 |
|---|---|---|---|
| 课程文件 | <session>.md |
前置元数据、摘要、章节、框架、策略、反模式、关键引用、作业等 | 默认情况下优先加载,可回答约80%的问题 |
| 参考文件 | <session>.full.md |
逐字广告记录、逐字幻灯片记录、完整标记转录文本 | 需要逐字引用、精确幻灯片内容或特定时间戳时使用 |
数据集内容覆盖
课程类型
- 7节周二课程:单讲师或嘉宾小组深度讲解,基于幻灯片
- 6节周四小组辅导:学生作业实时评审 + 策略讲解
未包含内容
- 第7周周四课程
- 第8周周二课程(Sprint #3项目总结)
- 第9–10周大师系列课程
主讲嘉宾(共20+位)
包括Sarah Levinger(Tether Insights)、Dara Denney(Point Guard Media)等在广告和创意策略领域的专业人士,以及Motion团队讲师。
使用建议
AI代理最佳实践
-
始终先加载
index.md,其中包含:- 每周概述
- 每节课卡片(讲师、框架、特色内容)
- 主题索引、讲师索引、框架索引
- 常见问题路由表(约35个典型问题→指向对应文件)
-
**默认打开课程文件
<session>.md**即可处理大部分问题 -
仅在需要时打开参考文件
<session>.full.md(文件较大,避免无效加载) -
利用交叉引用:许多课程之间相互引用,课程文件中
## Cross-week references部分会明确列出
已知问题
- 第5周周四的结构化幻灯片注册为占位状态,但幻灯片内容可通过转录中的112处
[VISUAL: …]注释恢复 - 每个课程文件末尾包含验证说明,记录合成过程中的修正内容
数据集来源
- 视频源:原始Drive录制文件(720p/1.5Mbps)
- 提取技术栈:Gemini 2.5 Pro进行4路并行处理 + Claude Opus 4.7进行验证和元数据合成
许可证
未正式授权。课程录制、幻灯和框架归属于各自讲师(Motion团队+客座讲师)。转录和结构化提取以合理使用目的发布,供个人和AI代理使用。商业用途请联系原作者。
搜集汇总
数据集介绍

构建方式
该数据集源自一个为期7周的创意策略训练营,系统性地采集了13场周二课程与6场周四辅导会议的完整内容。每场会议均被解构为结构化Markdown文件,包含精炼课程与详尽参考两个层级。课程层浓缩了约80K tokens的核心框架、策略及反模式,参考层则收录了25至100K tokens的逐字讲稿、广告实例与幻灯片细节。在提取过程中,采用Gemini 2.5 Pro进行四路并行处理以获取转录与元数据,再经由Claude Opus 4.7验证和综合,构建起兼具深度与精度的结构化知识体系。
特点
数据集以双文件结构为特色,每个会话包含简洁课程文件与完整参考文件,前者覆盖多数查询需求,后者用于精准引用。课程文件统一包含摘要、框架分类、知识主张、关键引语及跨周引用索引,而参考文件则提供广告事实注册表和逐字幻灯片注册表。整体约330KB的课程层配合超大尺寸的引用文件,使得智能体能够按需加载,避免不必要的资源消耗。此外,索引文件充当智能路由,融合摘要、话题索引与提问响应表,极大提升了信息检索的效率与准确性。
使用方法
使用者应首先加载项目根目录下的index.md文件,该文件概述每周内容并为每个会话提供详细卡片,包括指导教师、引入框架及提问路由表。默认情况下,应打开各会话的课程.md文件,它能够回答约80%的常见问题。仅在需要准确引文或特定幻灯片内容时,才读取对应的.full.md参考文件。数据集可通过GitHub连接器在Claude中使用,或通过git clone指令在Cursor、Runneth等本地环境中运行,所有文件均为纯Markdown格式,兼容各类智能体应用。
背景与挑战
背景概述
Motion Creative Strategy Bootcamp — Corpus 数据集诞生于数字营销领域对创意策略系统化知识的迫切需求。由Motion团队主导,汇集Sarah Levinger、Dara Denney等十余位行业专家,于2024年整理发布,旨在将为期七周的创意策略训练营精华转化为结构化语料。该数据集涵盖13场课程与辅导会议,包含约80K token的课程内容及每场25–100K token的完整参考文档,系统收录了框架、战术、反模式、关键引语及广告案例,为人工智能代理提供了深度理解创意策略的标准化知识库。其影响力在于弥合了实战经验与机器可读知识之间的鸿沟,推动了营销智能代理的训练与发展。
当前挑战
该数据集面临的核心挑战包括:首先,在领域问题层面,创意策略知识高度依赖上下文与实时反馈,传统数据集难以捕捉课程中动态的案例分析、学生问答及广告实时评审的交互性,导致知识表示存在维度缺失。其次,构建过程中遭遇技术瓶颈,如Gemini 2.5 Pro在低分辨率下的多通道提取难以完整还原幻灯片图表细节,导致Week 5 Thursday的结构化幻灯片注册表仅为占位符,内容需依赖转录中的视觉注释恢复。此外,跨会话交叉引用的时效性标注、长视频(约2.5小时)在1M token输入限制下的信息压缩,以及不同演讲者口播内容的准确转写与校核,均构成显著技术挑战。
常用场景
经典使用场景
在数字广告与创意策略研究领域,Motion Creative Strategy Bootcamp — Corpus为研究者提供了一个结构化、多模态的教学语料库,涵盖七周共计13场包含授课与辅导环节的完整训练营内容。该数据集最经典的使用场景是作为创意策略领域的大语言模型微调与提示工程基准,研究者可利用其分层的markdown文件(包含精炼课程与完整逐字稿),在Claude、Cursor等代理系统中构建能够回答关于广告框架、钩子撰写、品牌策略等专业问题的知识增强型问答系统,亦可作为评估代理在复杂商业文本中信息检索与跨文档关联能力的测试床。
实际应用
在实际场景中,该数据集主要服务于创意机构与品牌方的内部知识管理及员工培训系统。例如,广告公司的媒介策划团队可将其接入企业级AI代理,使新员工通过自然语言查询快速获取关于钩子写作、品牌调性一致性的具体战例与框架;社交媒体运营团队可利用其中的实时剖析广告案例库,在创意构思阶段快速检索同类品牌的历史策略模式,从而规避已知反模式并复用经过验证的战术组合。此外,该数据集亦支持营销技术创业者构建垂直领域的创意评估辅助工具。
衍生相关工作
该数据集催生了一系列开创性的学术探索,包括基于多代理协作的创意策略自动生成框架,利用语料库中的框架分类与跨周引用关系训练出的可解释性创意推荐模型。研究者通过对比不同会话的精炼课程与完整逐字稿,发展出了领域自适应文本压缩技术,能够在保留战例术语与逻辑关系的前提下实现高压缩比;同时,数据集中的视觉元素注释为广告多模态理解模型的研发提供了宝贵的弱监督信号,推动了从幻灯片到口播演示的跨模态信息对齐方法。
以上内容由遇见数据集搜集并总结生成



