可灵今天更新了 2.1 的首尾帧视频模型提示词理解和遵循能力大幅提升，即使好不相关的图片也可以实

可灵今天更新了 2.1 的首尾帧视频模型

提示词理解和遵循能力大幅提升，即使好不相关的图片也可以实现自然过渡

可以看我做的这个视频的效果，所有分镜都是一次生成没有抽卡，就是素材拼接没有剪辑

我还打磨了一套提示词和工作流帮你降低抽卡频率提高生成质量

模型测评和提示词在下面👇： https://t.co/9t7gwRq3Ay

懒得等施工🚧的也可以在这里看完整教程：

https://t.co/T72plhZPyI

在模型能力很强的情况下依然需要抽卡和没办法获得好素材的原因主要有两个：

首先是没办法获得合适的图片，第二点就是有了图片之后不会写提示词。

今天藏师傅就教一下从获取合适的图片素材以及如何写提示词两方面生成优质的首尾帧视频，顺便看看可灵 2.1 的首尾帧模型有多强大。 https://t.co/hPZSkhiMrh

首先我们来看一下如何获取用来做首尾帧视频生成的合适图片，我自己平时主要用三个方法：

- 相同提示词抽卡
- 修改提示词抽卡
- 使用 FLUX Kontext 等图像编辑模型对图片进行编辑。

首先是相同提示词抽卡：

由于是相同提示词并且很多模型在同时生成多张的时候种子是一致的，所以多张图中很容易找到相似度很高的图片，非常适合用来做展示类的首尾帧视频。

比如这个视频里面的角色展示的分镜就是相同提示词生成的，可以看到可灵过渡的非常好，尤其是面部，给人感觉连贯性很强。 https://t.co/BiEaPZ2ZbW

修改提示词抽卡：

如果我们要做画面中主要人物或者物品的移动或者消失出现，一个合适的方法就是，先写出尾帧的提示词，生成图片后根据需求更改其中的一部分就行。

比如这个富士山和汽车的画面就是先有汽车停在富士山下的提示词，然后在删掉汽车的部分完成的。 https://t.co/lzW01Ep6kK

使用图像编辑模型编辑：

我们最近有了不少可用的图像编辑模型。通过自然语言就可以编辑图片，这样我们就能实现对图片的精确控制，制作出各种特效。

比如将扁平的 Logo 图片变成有丰富材质和背景的视频，我就是拿了一张 Logo 图片然后用图片编辑模型让他加上材质更换背景。

最后在用可灵 2.1 首尾帧生成视频的时候可以看到从扁平到金属材质的过程可灵还加上了非常顺滑的过渡一点不突兀。

也可以让某个人物拿上东西或者放下东西，这个在电商场景非常实用。

比如下面这个就是用原始的模特图片和后面拿上产品的图片生成的，模特和产品都可以保持一致性，可用性相当高，而且可灵生成的时候完全没有常见的手部细节问题。 https://t.co/lgKfQnxXWY

当然我们也可以用这个方式去做非常炫酷的文字特效。

比如我这里就先生成了一个金属文字的 KLING，然后用图像编辑模型修改文字

我们也可以加上更加丰富的变化，比如每个分镜不止文字会变化文字材质和周围环境也发生变化，而且可灵 2.1 不止响应了文字本身的变化，环境的变化也跟文字是同步的。 https://t.co/NkkVZVMRPD

如何生成首尾帧视频的提示词

我上面所有的首尾帧的提示词没一个是我自己写的，完全是 AI 生成的。

先给大家用来生成首尾帧视频的提示词，然后教一下大家提示词为什么这么写。

这个提示词可以生效也是因为可灵 2.1 的首尾帧提示词理解和遵循能力大幅增强的缘故。 https://t.co/ISBGqqhUos

看下这个提示词有多强，他会自动判断两张图片的差异度，然后根据差异的不同采取不同的提示词生成策略。

这个提示词生成的视频提示需要模型有非常强的提示词理解和遵循能力，所以目前应该只有可灵 2.1 效果比较好。

比如这种两张图片有相关性的，他就会优先用原地演变的原则主要重点放在主体和环境身上，让人物穿衣服，背景的植物生长来完成首尾帧的转换。

歸藏(guizang.ai)