可灵 AI 全面迈入 2.0 时代，快手从“商业十字路口”找到了最终方向

十字路口Crossing · 科技自媒体 · 6 天前

主要观点总结

可灵AI 2.0的发布重新定义了视频与图像生成领域的商业价值与创作边界。文章详细介绍了可灵AI 2.0的新功能，包括语义响应、动态质量和画面质感的提升，以及可图2.0图像模型的发布。此外，文章还提到了可灵AI在人工智能生成内容领域的拓展和商业化路径。可灵AI 2.0为AIGC创作者带来灵感盛宴，但创作者需要权衡“灵感值”与会员套餐的选择。

关键观点总结

关键观点1: 可灵AI 2.0的提升

包括语义响应、动态质量和画面质感的显著提升，以及全新的基础模型可灵 2.0 （大师版）和可图 2.0 的推出。

关键观点2: 可灵AI 2.0的语义响应能力

体现在对视频镜头时间序列的控制能力提升，能够生成更复杂的动态镜头效果。

关键观点3: 可灵AI 2.0的动态质量提升

包括运动幅度、物体协调性和场景连贯性的进化，生成视频更接近电影级水准。

关键观点4: 可灵AI 2.0的画面质感升级

让生成内容的视觉表现力与美感达到新的高度，支持多种艺术风格，如写实、卡通、赛博朋克等。

关键观点5: 可图 2.0 的特点

包括语义遵循能力、对多种元素和复杂指令的响应能力，以及电影质感的提升。

关键观点6: 多模态编辑能力的上线

包括元素替换、删除和增加功能，以及局部重绘和扩图功能，使视频和图片编辑更加灵活。

关键观点7: 可灵AI在AIGC领域的影响力和商业化路径

通过举办各种活动和赛事，拓展在AIGC领域的影响力，并将技术赋能商业引擎。创作者需要权衡“灵感值”与会员套餐的选择。

正文

可灵 AI 全面迈入 2.0 时代，多少 AIGC 创作者悬着的心终于放下了。此刻，他们唯一担心的可能是可灵 2.0 的“灵感值”够不够用，哪一档会员比较值。

作为快手旗下最备受瞩目的 AI 创意生产力平台，可灵 AI 2.0 的发布无疑重新定义了视频与图像生成领域的商业价值与创作边界。

你的每一次奇思妙想，都在重新定义AI创作的边界。

前段时间，我们完整梳理了快手最近的财报：可灵 AI 累计业务收入已经超过 1 亿元。站在快手可灵 AI 的肩上，我们重新审视了“快手，你是谁？从哪里来？要到哪里去？”。

这回可灵 AI 2.0 的基础模型全面升级，更是印证了快手的野望——“无限可能的 AI 商业舞台正在梦想成真。”

可灵 AI 重点更新内容涵盖了 2 个基础模型——可灵 2.0 （大师版）、可图 2.0，以及全新上线的多模态编辑能力。

可灵 2.0 ——世出的大师，让梦成真

相对于可灵 1.6 模型，可灵 2.0（大师版）在以下几个方面得到了大幅度的提升：

语义响应更强 —— 心领神会
动态质量更优 —— 神态自然
画面质感更佳 —— 电影级审美

来源：X 网友@AiFreak_tool

1）语义响应：动作、表情、运镜

可灵 2.0 在语义响应能力上的提升获得显著提升，相较于可灵 1.6，其自然语言处理与提示词（prompt）理解能力显著更强，能够更精准地捕捉用户意图，生成符合预期的视频与图像内容。

X 上的大量 AI 视频内容创作者已经开始针对可灵 2.0 “狂轰乱炸”，疯狂安利了。

来源：X 网友@PJaccetturo

语义响应的大幅提升体现在了可灵 2.0 支持描述时序更复杂的镜头。

简单点说就是：增强了对视频镜头时间序列（时序）的控制能力，能够生成更复杂、更动态的镜头效果。

比如下面这张图片，搭配提示词：

女孩从静坐在公园长椅上，到慢慢走出画面，晨光逐渐转为正午烈日再过渡至暮色，天空色彩从粉橙渐变为湛蓝再转为紫红，来往行人形成流动的虚影轨迹，固定镜头，突出光影在长椅木纹上的缓慢爬行，飘落的树叶在长椅下堆积又随风卷起。

可灵 2.0 便能生成一段流畅且动态质量更优的视频，在光影、色彩与动态细节上具有惊艳的表现力。

不仅仅是简单的静态画面或单一运动，可灵 2.0 可以根据时间顺序生成多段、连续且逻辑连贯的镜头效果。

来源：X 网友@TechByMarkandey

2）动态质量：运动幅度、物体协调性、场景连贯性

可灵 2.0 同样在动态生成质量上提升了一大截，改变了视频生成领域的体验。相较于可灵 1.6，其在运动幅度、物体协调性与场景连贯性上实现了一定程度的进化，生成的视频更接近电影级水准。

可灵 2.0 能够精准呈现动作与镜头提示，动作过渡顺畅自然，视觉效果和细节风格都显得更加精致。

来源：X 网友@heyDhavall

从视觉呈现上来看，可灵 2.0 生成的视频风格一致性强，细节刻画丰富细腻，在一些场景层次内的渲染比较精细。

来源：X 网友@seiiiiiiiiiiru

可灵 2.0 在动作捕捉与镜头响应方面表现出很高的精准度，能够以高度真实的速度流畅处理复杂动作序列，整体呈现出来的动态效果可以说是比较写实的。

来源：X 网友@farah_tech_AI

3）画面质感：光影效果、艺术风格、画面表现

可灵 2.0 在画面质感上的升级，让生成内容的视觉表现力与美感达到了新的高度。

画面美感方面，可灵 2.0 较为出彩的一点是它支持 60+ 风格，写实、卡通、赛博朋克、水彩、油画以及未来主义都在其创作范围之内。

例如，古风和现代魔幻都市等题材，展现了可灵 2.0 在多种题材创作中的灵活性与潜力。

来源：X 网友@WuxiaRocks

上传一张孩子们海浪拍岸的同时，沿着沙滩奔跑嬉闹的图片，并配以提示词：

油画，孩子们在海边奔跑，海浪拍打着海岸。

可灵 2.0 能很好地捕捉孩子们奔跑的动态、海浪拍打的节奏以及油画的艺术质感。

它够理解复杂的描述，包括艺术风格（如“油画”）、动态元素（如“孩子们奔跑”“海浪拍打”）以及环境氛围（如“海边”“夕阳”）。

可图 2.0 —— 多风格，电影级别

这回与可灵 2.0 一同发布的还有可图 2.0 图像模型，主要有这么几个看点：

语义遵循能力
能够响应大量风格
电影质感

经常用各家文生图大模型的人肯定会遇到一些极为现实的问题：当提示词越写越长，涉及的元素、风格、细节要求越来越多时，模型的响应能力反而越来越失控。

这回的可图 2.0 可以对多种元素、复杂指令、颜色位置等响应有大幅度提升。

当文字描述提示词为：

一张超现实的照片，一条河从客厅墙上的油画中漂浮出来，洒在沙发和木地板上。这幅画描绘了山间一条宁静的河流。一艘船在水中轻轻摇晃，进入客厅。河流的边缘酒在木地板上，将艺术世界与现实融为一体。客厅装饰着高雅的家具和温馨的氛围，电影、照片。

文字描述提示词：

摆满了白色桌子的宴会厅，周围坐着的人在享用一顿美餐。

文字描述提示词：

工笔画，林黛玉，穿着唐代的服装，在咖啡店的角落，手里拿着一部智能手机，侧逆光，傍晚。

多模态编辑能力全面上线

除了基础模型的全面升级外，快手在产品上也回头看了下。可灵 1.6 和图像模型，都全面上线了多模态编辑能力。

现在的可灵 1.6 可以基于视频+文字/图片，对视频替换元素、增加元素、删除元素，以完成更好的画面表现。

具体效果为：

替换元素：在多关键帧指定连续内容选区，用1张参考图替换主体/背景，如换衣、人物修改。
删除元素：在多关键帧指定选区，删除主体/背景内容，如移除路人。
增加元素：通过1-2张参考图或文字描述，添加主体内容，如城市上空增加太空飞船。

多模态编辑的操作流程，比较简单。

配合提示词：

用【@图片】中的熊猫，替换【@视频】中的男人

原视频：

视频中的人物就会被替换成图片内容中的熊猫，画面的其他元素并不会被影响，熊猫形象自然融入视频场景，同时维持整体画面的协调性和真实感。

修改后视频：

与视频编辑功能一同上线的还有图片编辑功能，这回可灵生图终于支持局部重绘和扩图了：

局部重绘：
指定重绘区域，通过提示词描述目标内容，实现元素增加、修改等操作。
扩图：
自由调整扩图比例与尺寸，支持拖拽原图位置、改变大小，扩展画面内容。

如果想要图片中猫猫“戴上很酷的墨镜”，只需输入提示词，并指定重绘区域即可。

扩图功能，能够通过简单的文字提示词，扩增全新区域，同时确保画面自然流畅，风格一致。

只需输入文字提示词：

城市街道

有了 GPT-4o 的吉卜力风格大火全网，可图 2.0 也紧跟潮流，急速推出了”风格转绘“功能。

例如，3D 卡通动画风格转绘：

复古美少女风格转绘：

结合之前的扩图功能，可图 2.0 正在快速迭代和功能整合，打造一个全方位的图像处理生态。

不只是基础技术的全面升级，可灵 AI 在人工智能生成内容（AIGC）领域正在积极拓展其影响力。

可灵 AI 承办第十五届北京国际电影节AIGC电影单元

可灵 AI 2.0 灵感成真创作大赛

可灵 AI x 英雄联盟手游 AI 计划

可灵 AI 举办创意特效挑战赛……

等等，等等，无一不在说明可灵 AI 并非只是个基础模型制造厂商，快手的产品商业思维仍旧十分老道。

在 AIGC 领域，单纯地走技术路线，忽略商业路径，就无法在激烈的 AIGC 领域长久地走下去。

只有用 AI 解构应用，让用户解构 AI——构建生态之风，才能驱散 AI 产品头顶的商业化阴云。

不同活动针对不同用户群体，无论是专业影视创作者、创意爱好者，亦或是游戏内容创作者，都将会成为可灵 AI 用技术赋能商业引擎的动力。

对于 AIGC 创作者而言，可灵 AI 2.0 的到来无疑是一场灵感盛宴。

从短视频博主到影视制作团队，从小型电商到跨国品牌，每个人都能在这波技术浪潮中找到属于自己的商业机会。

唯一需要权衡的，或许只是“灵感值”与会员套餐的选择。

毕竟，当创意可以真正落地，真正的瓶颈可能只剩你的想象力了。

可灵 AI 全面迈入 2.0 时代， 快手从“商业十字路口”找到了最终方向