在 IMA Studio × Kestos 广告挑战赛 在洛杉矶,创作者们受邀为一家公司制作真正的商业广告。 凯斯托斯 ——一个运动服和休闲服品牌——运用人工智能工具。其中一位创作者,一位拥有电影制作背景的专业创意总监,赢得了…… 第二名. 这是他的完整工作流程。.

📺 在 IMA Studio 查看创作者的个人资料 | 观看成片 | 关于洛杉矶聚会活动 →
关于创作者
该工作流程的创建者是 南加州大学电影艺术学院毕业生 目前在一家名为 AI 原生公司的公司担任创意总监 热线. 他的日常工作是运用人工智能工具制作商业广告内容——不是做实验,而是根据实际需求交付专业水准的作品。此外,他还有一部个人电影长片正在筹备中。.
他的主要工具一直是希格斯菲尔德,但为了应对这次挑战,他全力以赴。 Ima Studio ——结果不言而喻。.
挑战简报
制作 Kestos 的 34 秒生活方式广告 — 一个以干燥、潮湿、都市生活和海洋为视觉主题的运动服装品牌。官方品牌 参考 图片和视觉素材由品牌方提供。.

所有视频输出:1080p,16:9,每个片段 4-8 秒。.
使用的工具: Veo 3.1 · Kling · Nano Banana Pro · Suno · ElevenLabs
总耗时: 6.5小时 · 总学分: 2,665 · 生成的任务: 34
第一步:从导演的思路出发,而不是从提示出发
在启用任何工具之前,他先锁定了叙事框架。他的创作研究过程:
- 学习 生活方式和香水广告 — 最擅长通过视觉效果传达感觉、气味和情感的类型
- 提炼情感核心: 新鲜空气 · 自由 · 释放
- 用手写下你的想法。, 然后最终确定一个六镜头叙事结构
- 叙事弧: 陆地→海洋 · 室内→室外
“电影人的思维方式最为重要。我从生活方式和香水广告中寻找灵感——那种通过视觉效果传达气味、感觉和情绪的广告。”
这部电影的潜台词: 无论你身处何种环境——城市通勤、海滩、健身房——该品牌都能让你感到舒适、自信和自由。.
要点: 提示只是指令。如果你自己都没决定要指示什么,任何人工智能模型都无法替你弄明白。.
步骤二:构建 3×3 故事板网格
叙事框架确定后,他开始创作。 约10个故事板参考图 在 3×3 网格中使用 Nano Banana Pro 用于图像生成(在 IMA Studio 之外)。每一帧都作为图像转视频生成的“第一帧”参考帧构建。.

布局工具:Figma。. 他拖拽故事板面板,比较构图,并绘制出完整的时间线逻辑——然后才生成一个视频片段。.
“9格网格,3×3视觉一致性。创建网格并将其拖入故事板。取出一张图片并将其放大至4K。”
关键技术: 提取最佳单帧故事板画面 → 升频至 4K → 用作视频首帧输入。这能显著提升下游输出的质量。.
步骤 3:在 IMA Studio 上生成视频片段
主要模型: Veo 3.1 (快速模式用于迭代速度,标准模式用于关键镜头)。Kling 模式会根据特定的运动需求选择性地使用。.
他的提示结构
每个视频片段都以结构化的JSON格式呈现:
{ "scene_description": "身穿蓝色衣服的女子正在健身房锻炼", "visual_style": "电影感十足的现代商业广告", "camera_movement": "从左到右围绕女子缓慢横向移动镜头", "lighting": "现代商业广告,电影感", "main_subject": "身穿蓝色衣服的女子", "action": "女子快速跳绳", "negative_prompt": "字幕,屏幕上的文字,说话,演讲,对话" }始终添加到 negative_prompt: 字幕、屏幕文字、说话、演讲、对话 — 消除商业视频中最常见的生成瑕疵。.
生成方法
- 先给出简单的提示。. 确认模型能够触动你的情感目标。之后进行完善。.
- 每张照片都有多种变化。. 同一场景,不同的镜头移动或动作——每种尝试 3 到 6 次。.
- 以帧选择而非全视频判断为准。. 逐帧浏览每个片段,选出最佳的单帧。将其作为下一个片段的首帧参考。.
实际成功率:~30%。. 专业AI视频制作意味着生成多个版本并从中进行选择。请据此合理安排预算和时间。.
场景分解
| 场景 | 模型 | 尝试 | 笔记 |
|---|---|---|---|
| 健身房锻炼特写镜头 | Veo 3.1 快速版 | 4+ | 跳绳、仰卧起坐、跑步机——根据不同的动作而有所不同 |
| 海浪拍打着海岸 | Veo 3.1 | 3 | 审查第一批后迅速改进 |
| 水下漂浮的女子 | Veo 3.1 预览 | 6 | 最复杂的场景——需要尝试次数最多。 |
| 都市生活/室内拍摄 | Veo 3.1 快速版 | 多种的 | 核心叙事弧镜头 |
第 4 步:通过 Ima Studio 上的 Suno 播放音乐
三种情绪提示,每种运行两次以增加变化:
动感健身音乐,节奏欢快。舒缓的氛围音垫,轻松惬意。80年代风格,性感迷人,令人沉醉。节奏适中。.
提示: 每个提示至少生成两个变体。即使是相同的提示,第一版和第二版之间的差异也可能很大——千万不要只采用第一版。.
第五步:通过 ElevenLabs 进行配音
由 ElevenLabs 生成的女性旁白,脚本取自 Kestos 的品牌文案。旁白以内心独白的形式呈现——主人公在影片中讲述自己的生活方式。.
提示: 录制旁白前先选好配乐。80年代氛围音乐的节奏直接影响了旁白的语速。.
步骤 6:在 DaVinci Resolve 中进行最终剪辑
- 以约3秒的间隔播放片段(标准生活方式商业广告节奏)
- 叠加音乐 + 配音
- 为了确保多个模型片段之间的色彩一致性,需要进行色彩分级。
- 添加品牌文字结束卡

Figma → DaVinci 交接: 在编辑之前先在 Figma 中绘制完整的时间线,意味着 DaVinci 只负责简单的组装工作,而不再是创意问题解决。这是整个工作流程中最节省时间的一步。.
生产数量
| 公制 | 价值 |
|---|---|
| 总时间 | 6.5 小时(03:03 – 09:29,单次课程) |
| 总任务数 | 34 |
| 总学分 | 2,665 |
| 最终切割长度 | 34秒 |
| 世代成功率 | ~30% |
| 主要视频模型 | Veo 3.1(快速+标准) |
| 故事板帧 | ~10(Nano Banana Pro) |
| 生成的音乐曲目 | 6(3 个提示 × 2) |
| 结果 | 🥈 IMA Studio × Kestos 广告挑战赛第二名 |
获得第二名的六条秘诀
- 首先要考虑导演的思路。. 在打开任何工具之前,先了解你的故事。.
- 3×3故事板网格。. 视觉一致性是在故事板阶段解决的,而不是在生成阶段解决的。.
- 尽早给出简单的提示。. 先找到情感目标,复杂性随后再考虑。.
- 预计成功率约为 30%。. 生成多个方案。选择最佳方案。制定预算。.
- Figma 作为创作平台。. 在编辑之前先规划好时间线——DaVinci 应该是组装工具,而不是发现工具。.
- 每项工作都应选择合适的车型。. Veo 3.1 用于电影视频 · Kling 用于动态效果 · Nano Banana Pro 用于故事板 · Suno 用于音乐 · ElevenLabs 用于配音。.
在 IMA Studio 上试试吧
工作流程中的每个工具——Veo 3.1、Kling、Suno 等——都可以在以下平台上使用: IMA工作室 使用单个账户。.
想参加下一届真实品牌人工智能产品挑战赛吗?请关注我们 洛杉矶聚会和 AI 制作活动 为即将到来的机遇做好准备。.
这是我们的一部分 创作者教程 系列——专业人士使用人工智能进行生产工作的真实工作流程。.


