可灵 AI 全面迈入 2.0 时代,多少 AIGC 创作者悬着的心终于放下了。此刻,他们唯一担心的可能是
可灵 2.0 的“灵感值”够不够用,哪一档会员比较值。
作为快手旗下最备受瞩目的 AI 创意生产力平台,可灵 AI 2.0 的发布无疑重新定义了视频与图像生成领域的商业价值与创作边界。

前段时间,我们完整梳理了快手最近的财报:可灵 AI 累计业务收入已经超过 1 亿元。站在快手可灵 AI 的肩上,我们重新审视了“快手,你是谁?从哪里来?要到哪里去?”。
可灵 AI 生成视频已突破 1.68 亿
这回可灵 AI 2.0 的基础模型全面升级,更是印证了快手的野望——“无限可能的 AI 商业舞台正在梦想成真。”
可灵 AI 重点更新内容涵盖了 2 个基础模型——可灵 2.0 (大师版)、可图 2.0,以及全新上线的多模态编辑能力。
可灵 2.0 ——世出的大师,让梦成真
相对于可灵 1.6 模型,可灵 2.0(大师版)在以下几个方面得到了大幅度的提升:
语义响应更强 —— 心领神会
动态质量更优 —— 神态自然
画面质感更佳 —— 电影级审美
来源:X 网友@AiFreak_tool
1)语义响应:动作、表情、运镜
可灵 2.0 在语义响应能力上的提升获得显著提升,相较于可灵 1.6,其自然语言处理与提示词(prompt)理解能力显著更强,能够更精准地捕捉用户意图,生成符合预期的视频与图像内容。
X 上的大量 AI 视频内容创作者已经开始针对可灵 2.0 “狂轰乱炸”,疯狂安利了。

来源:X 网友@PJaccetturo
语义响应的大幅提升体现在了可灵 2.0 支持描述时序更复杂的镜头。
简单点说就是:增强了对视频镜头时间序列(时序)的控制能力,能够生成更复杂、更动态的镜头效果。
比如下面这张图片,搭配提示词:
女孩从静坐在公园长椅上,到慢慢走出画面,晨光逐渐转为正午烈日再过渡至暮色,天空色彩从粉橙渐变为湛蓝再转为紫红,来往行人形成流动的虚影轨迹,固定镜头,突出光影在长椅木纹上的缓慢爬行,飘落的树叶在长椅下堆积又随风卷起。
可灵 2.0 便能生成一段流畅且动态质量更优的视频,在光影、色彩与动态细节上具有惊艳的表现力。
不仅仅是简单的静态画面或单一运动,可灵 2.0 可以根据时间顺序生成多段、连续且逻辑连贯的镜头效果。
来源:X 网友@TechByMarkandey
2)动态质量:运动幅度、物体协调性、场景连贯性
可灵 2.0 同样在动态生成质量上提升了一大截,改变了视频生成领域的体验。相较于可灵 1.6,其在运动幅度、物体协调性与场景连贯性上实现了一定程度的进化,生成的视频更接近电影级水准。
可灵 2.0 能够精准呈现动作与镜头提示,动作过渡顺畅自然,视觉效果和细节风格都显得更加精致。
来源:X 网友@heyDhavall
从视觉呈现上来看,可灵 2.0 生成的视频风格一致性强,细节刻画丰富细腻,在一些场景层次内的渲染比较精细。
来源:X 网友@seiiiiiiiiiiru
可灵 2.0 在动作捕捉与镜头响应方面表现出很高的精准度,能够以高度真实的速度流畅处理复杂动作序列,整体呈现出来的动态效果可以说是比较写实的。
来源:X 网友@farah_tech_AI
3)画面质感:光影效果、艺术风格、画面表现
可灵 2.0 在画面质感上的升级,让生成内容的视觉表现力与美感达到了新的高度。
画面美感方面,可灵 2.0 较为出彩的一点是它支持 60+ 风格,写实、卡通、赛博朋克、水彩、油画以及未来主义都在其创作范围之内。
例如,古风和现代魔幻都市等题材,展现了可灵 2.0 在多种题材创作中的灵活性与潜力。
来源:X 网友@WuxiaRocks
上传一张孩子们海浪拍岸的同时,沿着沙滩奔跑嬉闹的图片,并配以提示词:
油画,孩子们在海边奔跑,海浪拍打着海岸。

可灵 2.0 能很好地捕捉孩子们奔跑的动态、海浪拍打的节奏以及油画的艺术质感。
它够理解复杂的描述,包括艺术风格(如“油画”)、动态元素(如“孩子们奔跑”“海浪拍打”)以及环境氛围(如“海边”“夕阳”)。
可图 2.0 —— 多风格,电影级别
这回与可灵 2.0 一同发布的还有可图 2.0 图像模型,主要有这么几个看点:
语义遵循能力
能够响应大量风格
电影质感
经常用各家文生图大模型的人肯定会遇到一些极为现实的问题:当提示词越写越长,涉及的元素、风格、细节要求越来越多时,模型的响应能力反而越来越失控。
这回的可图 2.0 可以对多种元素、复杂指令、颜色位置等响应有大幅度提升。
当文字描述提示词为:
一张超现实的照片,一条河从客厅墙上的油画中漂浮出来,洒在沙发和木地板上。这幅画描绘了山间一条宁静的河流。一艘船在水中轻轻摇晃,进入客厅。河流的边缘酒在木地板上,将艺术世界与现实融为一体。客厅装饰着高雅的家具和温馨的氛围,电影、照片。

文字描述提示词:
摆满了白色桌子的宴会厅,周围坐着的人在享用一顿美餐。

文字描述提示词:
工笔画,林黛玉,穿着唐代的服装,在咖啡店的角落,手里拿着一部智能手机,侧逆光,傍晚。

多模态编辑能力全面上线
除了基础模型的全面升级外,快手在产品上也回头看了下。可灵 1.6 和图像模型,都全面上线了多模态编辑能力。
现在的可灵 1.6 可以基于视频+文字/图片,对视频替换元素、增加元素、删除元素,以完成更好的画面表现。
具体效果为:
替换元素:在多关键帧指定连续内容选区,用1张参考图替换主体/背景,如换衣、人物修改。
删除元素:在多关键帧指定选区,删除主体/背景内容,如移除路人。
增加元素:通过1-2张参考图或文字描述,添加主体内容,如城市上空增加太空飞船。
多模态编辑的操作流程,比较简单。
配合提示词:
用【@图片】中的熊猫,替换【@视频】中的男人

原视频:
视频中的人物就会被替换成图片内容中的熊猫,画面的其他元素并不会被影响,熊猫形象自然融入视频场景,同时维持整体画面的协调性和真实感。
修改后视频:
与视频编辑功能一同上线的还有
图片编辑功能,这回可灵生图终于支持局部重绘和扩图了:
如果想要图片中猫猫“戴上很酷的墨镜”,只需输入提示词,并指定重绘区域即可。
原图,修改区域,生成结果
扩图功能,能够通过简单的文字提示词,扩增全新区域,同时确保画面自然流畅,风格一致。
只需输入文字提示词:
城市街道
原图,扩图区域,生成结果
有了 GPT-4o 的吉卜力风格大火全网,可图 2.0 也紧跟潮流,急速推出了”风格转绘“功能。
例如,3D 卡通动画风格转绘:

复古美少女风格转绘:

结合之前的扩图功能,可图 2.0 正在快速迭代和功能整合,打造一个全方位的图像处理生态。
不只是基础技术的全面升级,可灵 AI 在人工智能生成内容(AIGC)领域正在积极拓展其影响力。
可灵 AI 承办第十五届北京国际电影节AIGC电影单元
等等,等等,无一不在说明可灵 AI 并非只是个基础模型制造厂商,快手的产品商业思维仍旧十分老道。
在 AIGC 领域,单纯地走技术路线,忽略商业路径,就无法在激烈的 AIGC 领域长久地走下去。
只有用 AI 解构应用,让用户解构 AI——构建生态之风,才能驱散 AI 产品头顶的商业化阴云。
不同活动针对不同用户群体,无论是专业影视创作者、创意爱好者,亦或是游戏内容创作者,都将会成为可灵 AI 用技术赋能商业引擎的动力。
对于 AIGC 创作者而言,可灵 AI 2.0 的到来无疑是一场灵感盛宴。

从短视频博主到影视制作团队,从小型电商到跨国品牌,每个人都能在这波技术浪潮中找到属于自己的商业机会。
唯一需要权衡的,或许只是“灵感值”与会员套餐的选择。
毕竟,当创意可以真正落地,真正的瓶颈可能只剩你的想象力了。
