首页   

可灵 AI 全面迈入 2.0 时代, 快手从“商业十字路口”找到了最终方向

十字路口Crossing  · 科技自媒体  · 6 天前

主要观点总结

可灵AI 2.0的发布重新定义了视频与图像生成领域的商业价值与创作边界。文章详细介绍了可灵AI 2.0的新功能,包括语义响应、动态质量和画面质感的提升,以及可图2.0图像模型的发布。此外,文章还提到了可灵AI在人工智能生成内容领域的拓展和商业化路径。可灵AI 2.0为AIGC创作者带来灵感盛宴,但创作者需要权衡“灵感值”与会员套餐的选择。

关键观点总结

关键观点1: 可灵AI 2.0的提升

包括语义响应、动态质量和画面质感的显著提升,以及全新的基础模型可灵 2.0 (大师版)和可图 2.0 的推出。

关键观点2: 可灵AI 2.0的语义响应能力

体现在对视频镜头时间序列的控制能力提升,能够生成更复杂的动态镜头效果。

关键观点3: 可灵AI 2.0的动态质量提升

包括运动幅度、物体协调性和场景连贯性的进化,生成视频更接近电影级水准。

关键观点4: 可灵AI 2.0的画面质感升级

让生成内容的视觉表现力与美感达到新的高度,支持多种艺术风格,如写实、卡通、赛博朋克等。

关键观点5: 可图 2.0 的特点

包括语义遵循能力、对多种元素和复杂指令的响应能力,以及电影质感的提升。

关键观点6: 多模态编辑能力的上线

包括元素替换、删除和增加功能,以及局部重绘和扩图功能,使视频和图片编辑更加灵活。

关键观点7: 可灵AI在AIGC领域的影响力和商业化路径

通过举办各种活动和赛事,拓展在AIGC领域的影响力,并将技术赋能商业引擎。创作者需要权衡“灵感值”与会员套餐的选择。


正文

可灵 AI 全面迈入 2.0 时代,多少 AIGC 创作者悬着的心终于放下了。此刻,他们唯一担心的可能是 可灵 2.0 的“灵感值”够不够用,哪一档会员比较值


作为快手旗下最备受瞩目的 AI 创意生产力平台,可灵 AI 2.0 的发布无疑重新定义了视频与图像生成领域的商业价值与创作边界


你的每一次奇思妙想,都在重新定义AI创作的边界。


loading


前段时间,我们完整梳理了快手最近的财报:可灵 AI 累计业务收入已经超过 1 亿元。站在快手可灵 AI 的肩上,我们重新审视了“快手,你是谁?从哪里来?要到哪里去”。


loading
可灵 AI 生成视频已突破 1.68 亿


这回可灵 AI 2.0 的基础模型全面升级,更是印证了快手的野望——“无限可能的 AI 商业舞台正在梦想成真。


可灵 AI 重点更新内容涵盖了 2 个基础模型——可灵 2.0 (大师版)、可图 2.0,以及全新上线的多模态编辑能力

可灵 2.0 ——世出的大师,让梦成真


相对于可灵 1.6 模型,可灵 2.0(大师版)在以下几个方面得到了大幅度的提升:


  1. 语义响应更强 —— 心领神会

  2. 动态质量更优 —— 神态自然

  3. 画面质感更佳 —— 电影级审美


来源:X 网友@AiFreak_tool


1)语义响应:动作、表情、运镜


可灵 2.0 在语义响应能力上的提升获得显著提升,相较于可灵 1.6,其自然语言处理与提示词(prompt)理解能力显著更强,能够更精准地捕捉用户意图,生成符合预期的视频与图像内容。


X 上的大量 AI 视频内容创作者已经开始针对可灵 2.0 “狂轰乱炸”,疯狂安利了。


loading

来源:X 网友@PJaccetturo


语义响应的大幅提升体现在了可灵 2.0 支持描述时序更复杂的镜头


简单点说就是:增强了对视频镜头时间序列(时序)的控制能力,能够生成更复杂、更动态的镜头效果


比如下面这张图片,搭配提示词:


女孩从静坐在公园长椅上,到慢慢走出画面,晨光逐渐转为正午烈日再过渡至暮色,天空色彩从粉橙渐变为湛蓝再转为紫红,来往行人形成流动的虚影轨迹,固定镜头,突出光影在长椅木纹上的缓慢爬行,飘落的树叶在长椅下堆积又随风卷起。


loading


可灵 2.0 便能生成一段流畅且动态质量更优的视频,在光影、色彩与动态细节上具有惊艳的表现力。



不仅仅是简单的静态画面或单一运动,可灵 2.0 可以根据时间顺序生成多段、连续且逻辑连贯的镜头效果


来源:X 网友@TechByMarkandey


2)动态质量:运动幅度、物体协调性、场景连贯性


可灵 2.0 同样在动态生成质量上提升了一大截,改变了视频生成领域的体验。相较于可灵 1.6,其在运动幅度、物体协调性场景连贯性上实现了一定程度的进化,生成的视频更接近电影级水准。


可灵 2.0 能够精准呈现动作与镜头提示,动作过渡顺畅自然,视觉效果和细节风格都显得更加精致。


来源:X 网友@heyDhavall


从视觉呈现上来看,可灵 2.0 生成的视频风格一致性强,细节刻画丰富细腻,在一些场景层次内的渲染比较精细。


来源:X 网友@seiiiiiiiiiiru


可灵 2.0 在动作捕捉与镜头响应方面表现出很高的精准度,能够以高度真实的速度流畅处理复杂动作序列,整体呈现出来的动态效果可以说是比较写实的。


来源:X 网友@farah_tech_AI


3)画面质感:光影效果、艺术风格、画面表现


可灵 2.0 在画面质感上的升级,让生成内容的视觉表现力与美感达到了新的高度。


画面美感方面,可灵 2.0 较为出彩的一点是它支持 60+ 风格,写实、卡通、赛博朋克、水彩、油画以及未来主义都在其创作范围之内。


例如,古风和现代魔幻都市等题材,展现了可灵 2.0 在多种题材创作中的灵活性与潜力。


来源:X 网友@WuxiaRocks


上传一张孩子们海浪拍岸的同时,沿着沙滩奔跑嬉闹的图片,并配以提示词:


油画,孩子们在海边奔跑,海浪拍打着海岸。


loading


可灵 2.0 能很好地捕捉孩子们奔跑的动态海浪拍打的节奏以及油画的艺术质感


它够理解复杂的描述,包括艺术风格(如“油画”)、动态元素(如“孩子们奔跑”“海浪拍打”)以及环境氛围(如“海边”“夕阳”)。

可图 2.0 —— 多风格,电影级别


这回与可灵 2.0 一同发布的还有可图 2.0 图像模型,主要有这么几个看点:


  1. 语义遵循能力

  2. 能够响应大量风格

  3. 电影质感


经常用各家文生图大模型的人肯定会遇到一些极为现实的问题:当提示词越写越长,涉及的元素、风格、细节要求越来越多时,模型的响应能力反而越来越失控。


这回的可图 2.0 可以对多种元素、复杂指令、颜色位置等响应有大幅度提升。


当文字描述提示词为:


一张超现实的照片,一条河从客厅墙上的油画中漂浮出来,洒在沙发和木地板上。这幅画描绘了山间一条宁静的河流。一艘船在水中轻轻摇晃,进入客厅。河流的边缘酒在木地板上,将艺术世界与现实融为一体。客厅装饰着高雅的家具和温馨的氛围,电影、照片。


loading


文字描述提示词:


摆满了白色桌子的宴会厅,周围坐着的人在享用一顿美餐。


loading


文字描述提示词:


工笔画,林黛玉,穿着唐代的服装,在咖啡店的角落,手里拿着一部智能手机,侧逆光,傍晚。


loading

多模态编辑能力全面上线


除了基础模型的全面升级外,快手在产品上也回头看了下。可灵 1.6 和图像模型,都全面上线了多模态编辑能力。


现在的可灵 1.6 可以基于视频+文字/图片,对视频替换元素、增加元素、删除元素,以完成更好的画面表现。


具体效果为:


  • 替换元素:在多关键帧指定连续内容选区,用1张参考图替换主体/背景,如换衣、人物修改。

  • 删除元素:在多关键帧指定选区,删除主体/背景内容,如移除路人。

  • 增加元素:通过1-2张参考图或文字描述,添加主体内容,如城市上空增加太空飞船。


多模态编辑的操作流程,比较简单。


配合提示词:


用【@图片】中的熊猫,替换【@视频】中的男人


loading


原视频:



视频中的人物就会被替换成图片内容中的熊猫,画面的其他元素并不会被影响,熊猫形象自然融入视频场景,同时维持整体画面的协调性和真实感


修改后视频:



与视频编辑功能一同上线的还有 图片编辑功能,这回可灵生图终于支持局部重绘和扩图了:


  • 局部重绘

  • 指定重绘区域,通过提示词描述目标内容,实现元素增加、修改等操作。

  • 扩图

  • 自由调整扩图比例与尺寸,支持拖拽原图位置、改变大小,扩展画面内容。


如果想要图片中猫猫“戴上很酷的墨镜”,只需输入提示词,并指定重绘区域即可。

loading
原图,修改区域,生成结果


扩图功能,能够通过简单的文字提示词,扩增全新区域,同时确保画面自然流畅,风格一致。


只需输入文字提示词:


城市街道


loading
原图,扩图区域,生成结果


有了 GPT-4o 的吉卜力风格大火全网,可图 2.0 也紧跟潮流,急速推出了”风格转绘“功能。


例如,3D 卡通动画风格转绘:


loading


复古美少女风格转绘:


loading


结合之前的扩图功能,可图 2.0 正在快速迭代和功能整合,打造一个全方位的图像处理生态。


不只是基础技术的全面升级,可灵 AI 在人工智能生成内容(AIGC)领域正在积极拓展其影响力。


可灵 AI 承办第十五届北京国际电影节AIGC电影单元

可灵 AI 2.0 灵感成真创作大赛

可灵 AI x 英雄联盟手游 AI 计划

可灵 AI 举办创意特效挑战赛……


等等,等等,无一不在说明可灵 AI 并非只是个基础模型制造厂商快手的产品商业思维仍旧十分老道。


在 AIGC 领域,单纯地走技术路线,忽略商业路径,就无法在激烈的 AIGC 领域长久地走下去。


只有用 AI 解构应用,让用户解构 AI——构建生态之风,才能驱散 AI 产品头顶的商业化阴云


不同活动针对不同用户群体,无论是专业影视创作者、创意爱好者,亦或是游戏内容创作者,都将会成为可灵 AI 用技术赋能商业引擎的动力


对于 AIGC 创作者而言,可灵 AI 2.0 的到来无疑是一场灵感盛宴。


loading


从短视频博主到影视制作团队,从小型电商到跨国品牌,每个人都能在这波技术浪潮中找到属于自己的商业机会。


唯一需要权衡的,或许只是“灵感值”与会员套餐的选择。


毕竟,当创意可以真正落地,真正的瓶颈可能只剩你的想象力了。



loading

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com