如何扩展你的模型（How to Scale Your Model-20250226185055（微信文章未删减版）

首页

正文

2025-02-26 18:50
本条微博链接

如何扩展你的模型（How to Scale Your Model
，A Systems View of LLMs on TPUs）

训练 LLM 往往感觉像炼金术，但理解和优化模型的性能却并非如此。本书旨在揭开在 TPU 上扩展语言模型的科学之谜：

TPU 如何工作以及它们如何相互通信、LLM 如何在真实硬件上运行以及如何在训练和推理过程中并行化模型，以便它们在大规模下高效运行。如果您曾经想过“训练这个 LLM 的成本应该有多高”或“我自己需要多少内存来为这个模型提供服务”或“什么是 AllGather”，希望这对您有所帮助。

访问：jax-ml.github.io/scaling-book/

#ai创造营##deepseek##ai#

推荐文章

【[172星]Prompt-Kit：为AI应用提供高质... · 爱可可-爱生活 · 15 小时前

阿里扔“王炸”！ · 财联社AI daily · 19 小时前

阿里扔“王炸”！ · 财联社AI daily · 19 小时前

【英伟达面向Blackwell架构优化的DeepSee... · 爱可可-爱生活 · 昨天

[LG] Sheaf theory: from dee... · 爱可可-爱生活 · 2 天前

【jaxmp：基于JAX的机器人库，让机器人任务规划变... · 爱可可-爱生活 · 2 天前

【惠民保】保险买手第11周惠民保周报！ · BAOXIAN买手带你买足保障 · 2 年前

【交通】沪公交行业优胜示范线路和站点出炉 · 上海发布 · 3 年前

澳洲这工作一天6000元，但大部分人不愿意做，因为工作... · 今日悉尼 · 6 年前

京津冀旅游协同发展的几个问题（上） · 社科院旅游研究中心 · 6 年前

广州车展新能源车再创纪录谁起了重要作用？ · 河马推车 · 7 年前

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com