英伟达(Nvidia)的一举一动,都吸引着大家的目光。
近日, SIGGRAPH 2024 上,英伟达公布了一系列软件更新,主要涉及AI推理的云原生微服务——NIM(Nvidia Inference Microservices)全新升级,并且通过NIM 将生成式 AI 应用于 USD(通用场景描述),拓宽AI在3D世界的可能性。
更为重磅的是,英伟达发送 Blackwell 架构的样品,这是英伟达今年首发的新款芯片架构。
与此同时,如日中天的英伟达,也正面临着客户与竞品的潜在威胁。
“千呼万唤始出来。”
6月2日,黄仁勋宣布,目前“全球最强大的芯片”Blackwell芯片现已开始投产。
直到最近,我们有机会看到了 Supermicro 版本的 NVIDIA GB200 NVL72。
Supermicro NVIDIA GB200 NVL72 是 Supermicro 的 NVIDIA Grace Blackwell 200 NVLink 72 GPU 机架版本。
B200 拥有 2080 亿个晶体管,可提供高达 20 petaflops 的 FP4 计算能力。训练一个 1.8 万亿参数模型需要 8,000 个 Hopper GPU,消耗 15 兆瓦的功率。
对于大型语言模型推理工作负载,GB200 超级芯片的性能是 H100 GPU 的 30 倍,并且显著降低了功耗。
定价方面,今年早些时候,首席执行官黄仁勋告诉 CNBC,Blackwell GPU 的价格为 3 万至 4 万美元。以此推算,每台 AI 服务器机柜的价格约为 200 万至 300 万美元,而 Nvidia 计划出货 6 万至 7 万台 B200 服务器机柜,预计年收入至少为 2100 亿美元。
毫无疑问,无论成本有多高,AI公司愿意为此买单。
摩根士丹利称,由于需求旺盛,Nvidia 将台积电的订单量增加了约 25%。可以毫不夸张地说,Blackwell 将成为AI 训练和许多推理工作负载的事实标准,它为一系列下一代应用如机器人、自动驾驶汽车、工程模拟和医疗等提供了强力支持。
此前,今年 3 月英伟达推出 NIM 时介绍,NIM 提供经过优化的推理微服务,旨在缩短上市时间,并简化生成式 AI 模型在云、数据中心和 GPU 加速工作站的任何位置的部署。
开发者可以使用英伟达托管的云API测试新的生成式 AI 模型,或者通过下载 NIM 来自行托管模型,并在主要云提供商或本地使用 Kubernetes 快速部署,以减少开发时间、复杂性和成本。
NIM微服务通过打包算法、系统和运行时优化并添加行业标准 API 来简化 AI 模型部署流程。这使开发者能够将 NIM 集成到其现有应用程序App和基础设施中,无需大量定制或专业知识。
近日,英伟达宣布更新扩大的 NIM 推理微服务库,涵盖了物质世界环境、高级视觉建模和各种垂直应用。
英伟达已在预览版中提供了约 100项NIM推理微服务,现在要发布完整版本。比如,作为英伟达的部分新NIM,视觉媒体公司Getty Images Holdings的4K 图像生成 API 和图像、影片、音乐等数字内容供应商Shutterstock Inc. 的3D图像生成器即将上线。两者都使用英伟达的Nvidia Edify,它是一种用于视觉生成 AI 的多模式架构。
Nvidia NIM通过提供预训练的AI模型和标准化的API,大大简化了AI模型的开发和部署过程,这或许也意味着普通程序员的任务可以由NIM预先完成,普通程序员可能不再需要进行复杂的模型训练和调优工作。
同时,英伟达宣布,构建了世界上首个能够理解基于 OpenUSD(Universal Scene Description 通用场景描述)语言、几何、材料、物理和空间的生成性AI模型,并将这些模型打包为Nvidia NIM微服务。Nvidia还宣布即将推出几种新的NIM微服务,包括USD Layout、USD Smart Material和FDB Mesh Generation,以进一步提升开发者在开放USD平台上的应用能力和效率。
英伟达还与自然语言处理(NLP)工具集和平台Hugging Face合作,推出了推理即服务,帮助开发人员使用托管在 Hugging Face Hub 上的开源AI模型快速制作原型,并将其部署到生产中,这一合作将简化开发者的AI模型部署。
此外,英伟达推出基于 OpenVDB 的 fVDB,利用现实世界的 3D 数据,打造空间智能。推出 Isaac Lab,为不同的训练环境提供模块化的高保真模拟,提供物质世界 AI 功能和 GPU 驱动的物质世界模拟。
英伟达风光无限的同时,也面临着各方面的质疑与威胁。
近日,在Meta的Llama 3.1训练过程中,其运行的1.6万个GPU训练集群每3小时就会出现一次故障,意外故障中的半数都是由英伟达H100 GPU和HBM3内存故障造成的。
这难免不令人质疑,这家芯片巨头的垄断地位的真正实力。
此外,在英伟达最新Blackwell架构产品问世前夕,传出大幅削减用于游戏等应用的高阶GPU供应量,减幅最高达五成,近期更扩大缩减供应力道,使得板卡(即显卡)供给恐面临严重短缺,报价涨声响起。
随着英伟达显卡报价再度看涨,华硕、微星、技嘉等板卡厂营运有望受惠。
竞品AMD更是大刀阔斧,和英伟达贴身肉搏。
近日,AMD计划在台湾投资53.3亿元新台币建设研发中心,专注于AI软硬件开发和先进封装技术,以挑战英伟达在AI芯片市场的主导地位。
尽管英伟达在AI数据中心市场拥有98%的份额,AMD和英特尔的市场份额较小,但AMD正通过加速投资和收购AI公司,来加强其在AI领域的竞争力。
英伟达的大客户之一的苹果,则正在寻找Nvidia的替代品。
苹果表示,其在人工智能训练中依赖 Alphabet 设计的TPU芯片,而非行业领导者 Nvidia。
据谷歌网站称,如果提前三年预订,谷歌最新的 TPU 每小时使用成本不到 2 美元。谷歌于 2015 年首次推出 TPU 用于内部工作负载,并于 2017 年向公众开放。它们现在是专为人工智能设计的最成熟的定制芯片之一。
尽管如此,谷歌仍是 Nvidia 最大的客户之一。它使用 Nvidia 的 GPU 和自己的 TPU 来训练 AI 系统,并且还在其云端出售 Nvidia 技术的访问权限。
技术作为生产力,引领着新一轮AI产业的革新。
目前,曾一度登顶全球最高市值的英伟达市值已经跌至2.75万亿美元,Blackwell芯片的推出,能否让英伟达如部分机构预测,市值可以达到5万亿美元?