文章介绍了智谱AI在面对美国实体清单影响及全球AI禁令情况下的应对策略,以及最新发布的三大模型和升级情况。
文中详细描述了美国将智谱AI列入实体清单的理由和背后的政策意图。
这些模型在语音交互、视觉理解和商业场景应用等方面具有创新性和广泛应用前景。
这些免费模型包括语言、多模态理解、多模态生成功能,为开发者提供了便利。
和前天如出一辙的公告又来了!刚刚,美国首个全球 AI 禁令正式颁布!
而现在,美国对中国 AI 的限制正在从芯片蔓延到其他领域。
就在凌晨,美国商务部工业和安全局(BIS)更新了出口管制实体清单。
更新的出口管制实体清单中,就新增了「智谱 AI」。
智谱 AI 被全面拉黑
在 BIS 的第一份文档中,将 11 家中国 AI 企业列入实体清单,其中 10 家实体均是智谱旗下的。
文件中列出的理由是:
这些实体通过开发和整合先进的人工智能研究,来推进中国的军事现代化。根据《出口管理条例》(EAR)第744.11节,这种活动违反了美国的国家安全和外交政策利益。美国商务部长吉娜·雷蒙多(Gina Marie Raimondo)则在另外一份声明中表示:「这些规则将进一步加强我们的控制,确保中国无法对美国的安全造成任何威胁。」「掌握全链路大模型核心技术」,自主可控是智谱的底气。
不惧制裁,连发三大模型
就在下午,智谱 AI 也第一时间发布了三大全新模型(Realtime、Air、4V-Plus),做出了强有力的回应。GLM-Realtime 是全新推出的端到端模型,可以实时地理解视频内容,支持长达两分钟的记忆,能做到说视频,直接跟现实生活、物理世界看到的东西进行一个交互。在语音交互方面,尤其创新性地实现了清唱功能,首次让大模型具备在对话中的歌唱能力。 此外,Realtime 进一步支持 Function Call 功能。不仅能够依靠自身的知识和能力,还能灵活调用外部知识和工具,从而能够拓展到更广泛的商业场景。 这样的话想象空间就非常大了,想象以后的 agent,每个人都会拥有一个 AI 的管家,帮大家去做一些相关的现实生活中的问题,比如你想去北京玩,它能告诉你天气,还能帮你订酒店。
GLM-4-Air 全面升级
智谱 AI 基于对话和文本创作的实际需求,对 GLM-4-Air 进行全方位升级,进而诞生了 GLM-4-Air-0111。
此版本对训练数据与流程进行深度优化,通过算法改进,在某些维度可以取得与规模更大的模型GLM-4-Plus接近的性能。
同时,模型配置却保持精简,有效避免了资源的过度占用。值得一提的是,相较于前代,它的调用费用降低了一半,显著减轻了开发和部署的成本压力。
GLM-4V-Plus 全面升级
GLM-4V-Plus 则升级了视觉理解能力。
新版本具备长达2小时的视频理解能力;同时具有广泛的兼容性。它可以处理 224×224 的低分辨率图像,也能应对 4K 超清的高分辨率图像,对于极长宽比图像也能适配。
在保证高效识别的同时,GLM-4V-Plus 减少了 Token 消耗。
在多个公开榜单测试中,GLM-4V-Plus 相较于之前版本有明显的效果提升。
加速全民 AI,发出中国声
智谱设置了针对全社会免费开放 Flash 系列普惠模型 API。作为行业首个全模态的免费系列模型,开发者可以免费调用语言、多模态理解、多模态生成功能。
目前智谱已经开放了全新的「Flash全模态全家桶」供大家使用,分别是:
GLM-4-Flash 语言模型:适用于智能问答、摘要生成和文本数据处理等场景。
GLM-4V-Flash 图像理解模型:适用于图像识别、图像问答、图像推理等场景。
Cogview-3-Flash图像生成模型:应用于艺术创作、设计参考、游戏开发、虚拟现实等领域。
CogVideoX-Flash视频生成模型:支持文生视频,依据输入的文本描述生成相应的动态视频内容;还支持图生视频,能够对输入的图片进行深度解析,提取图片中的关键信息、元素特征及潜在语义。
面对美国的限制,智谱 AI 不仅没有退缩,反而加速前行。
连发三大模型、升级普惠模型,都在为全民 AI 时代添砖加瓦。
凭能力解开实体的束缚,发出中国声。
期待在智谱的推动下,AI 能真正融入生活、工作、行业场景,为世界带来更多惊喜与改变。
One More Thing
支持国产大模型,从我做起。
Datawhale 贴心地给大家准备了「智谱 AI」动手实践教程(入门篇)。
笔者是 Datawhale 成员、教育领域的工作人员,我这边就以我的视角给大家展示一些智谱免费模型的效果。
这里我教大家 GLM-4V-Flash 模型批改作业~
其他的模型及方案会在教程中更新,教程地址:https://spvrm23ffj.feishu.cn/docx/V9gidaXRyohRMBxWDIycSru6n5g
△ 批改作业
GLM-4V-Flash
import gradio as gr
import base64
from zhipuai import ZhipuAI
api_key =""
client = ZhipuAI(api_key=api_key)
def ask_question(image_path, text_input):
try:
with open(image_path, 'rb') as img_file:
img_base = base64.b64encode(img_file.read()).decode('utf-8')
messages = [
{
"role": "user",
"content": [
{"type": "image_url", "image_url": {"url": img_base}},
{"type": "text", "text": text_input},
],
}
]
response = client.chat.completions.create(
model="glm-4v-flash",
messages=messages,
)
assistant_message = response.choices[0].message.content
except Exception as e:
assistant_message = f"调用模型时发生错误:{e}"
return assistant_message
with gr.Blocks() as demo:
gr.Markdown("# 智谱AI问答界面")
gr.Markdown("上传图片并输入问题,让AI为您解答。")
image_input = gr.Image(type="filepath", label="上传图片")
text_input = gr.Textbox(label="输入问题", placeholder="例如:请描述这个图片")
submit_button = gr.Button("提交")
output = gr.Textbox(label="AI回复")
submit_button.click(ask_question, inputs=[image_input, text_input], outputs=output)
demo.launch()
成果展示