主要观点总结
本文主要介绍了清华系算力网络与算力建维服务商“基流科技”的近期发展。该公司获得了多轮投资,致力于解决AI基础设施的分布式计算通信难题,并在多个领域取得了显著成果。基流科技还面临着打造大规模且稳定的算力集群的挑战,同时推动高速算力互联硬件的国产化进程。
关键观点总结
关键观点1: 完成Pre A+和A轮融资,投资方包括招商局创投等。
基流科技近期完成了多轮融资,募集资金将用于产品研发、市场推广和日常运营。
关键观点2: 基流科技的历史投资方包括多家战投与国资基金。
这表明基流科技在人工智能领域的发展受到了广泛关注和认可。
关键观点3: 基流科技成立以来实现了从百卡到万卡的升级,支持多个智算集群落地。
这表明基流科技在AI基础设施领域具备强大的技术实力和丰富的实践经验。
关键观点4:
这表明基流科技在人工智能领域有着长远的发展规划和战略眼光。
正文
封面来源|IC Photo
36氪获悉,清华系算力网络与算力建维服务商“基流科技”近期完成Pre A+和A轮融资,由招商局创投、华泰创新、星连资本、国方创新联合投资,老股东卓源亚洲、光速光合跟投,募集资金将主要用于产品研发、市场推广和日常运营。基流科技的历史投资方包括了多家战投与国资基金,累计融资总额超亿元。基流科技成立于2023年2月,源自清华大学网络安全实验室,公司攻克AI基础设施的分布式计算通信难题,在高速组网、集合通信、并行框架、管控调度等方面形成了一系列关键技术。自成立以来,基流科技已实现从百卡、千卡到万卡,从集群组网、调优到集群运维的升级。截至目前,公司已支持十余个智算集群落地,累计建设调优集群的FP16算力超过40EFLOPs。公司已服务包括智谱AI、商汤科技、数据中心、运营商、地方国企在内的多个头部用户。作为推动人工智能发展的三大要素之一,算力是人工智能的“发动机”和核心驱动力,也成为继水、电、气、路、网之后的新型基础设施。今年9月发布的《中国综合算力指数报告(2024)》指出,过去20年间,我国智能算力需求增长了百亿倍,而随着AI、具身智能等产业的快速发展,我国智算规模还将进一步急剧增长。一万张及以上的加速卡组成的“万卡集群”也将越来越多。越是规模大的算力集群,网络通信和GPU组件故障的概率越高,快速打造大规模且稳定的算力集群,同时又做到高性价比,是一项全球共同面对的挑战。而这正是基流科技要实现的目标。正如互联网时代的巨头思科主要解决互联网扩展和连接问题,算力网络服务商角色就相当于大模型时代的思科。算力网络具有重要战略意义,近期英伟达因收购高性能网络公司迈络思被市场监管总局展开反垄断调查,GPU的专用网络互联设备和高速以太网网卡需要打破封锁。“人工智能对算力的需求和传统IT有很大差别,因此需要重新设计网络架构,相关技术还处于初期阶段,在分布式计算框架、硬件设备甚至芯片方面还有很大的想象空间。” 基流科技创始人胡效赫对36氪表示。目前国内有万卡以上大规模集群建维技术能力的团队很少,行业内也普遍缺乏算力集群落地经验与标准。而基流科技是国内极少数拥有万卡集群落地经验的AI基础设施厂商,经历了国内算力规模从千卡到万卡功能的升级。团队方面,创始人胡效赫是清华大学博士、博士后,加州伯克利大学访问学者,在高性能网络和高性能计算方向做了十余年研究,其在创业前就已经落地了全国首个运营商级Tbps可编程网络产品。团队成员则源自清华、北大、北邮、北航等一线高校,阿里、美团、中兴等互联网和设备厂商,其中多名成员有超过二十年产研经验。得益于赛道的爆发式增长,基流科技也在快速成长当中。据了解,2023年公司确认收入数千万元,2024年预计收入将超亿元。产品方面,基流科技目前主要有三部分,算力调度优化平台、算力建设运维平台和高速互联硬件。除了整套算力集群建设解决方案外,公司在集群管理、计算框架和高速网络三个层次上都进行了产品化并有逐步落地,并尽可能地提高交付效率、GPU利用率和集群稳定性。胡效赫告诉36氪,目前基流科技的算力集群方案在生产环境中可以为GPU集群提升超10%的性能,帮助客户在千卡落地中节省成本上千万元,在万卡落地中节省数亿元。对于更大规模的十万卡集群建设,胡效赫坦言“国内还没人知道十万卡该怎么构建以及如何使用,还需要继续探索。” 而基流科技团队已经开始投入十万卡仿真和未来架构设计的项目研发。胡效赫表示,算力网络的核心组件网卡、线缆、交换机,预计在2025年将实现端到端的国产化,通过软硬件联合设计的方法,优化算法、工艺与供应链,以系统带动芯片发展,实现硬件开放生态,软件自主可控。“随着人工智能产业快速发展,未来一到两年,国内一定会产生十万卡集群。在战略层面上,这是一个优质供给和需求匹配的过程。”胡效赫表示,基流科技将继续发力超大规模集群的组网、调优和维护,为服务国家大战略做出贡献。
2024,「撕」得好!
五位国家经理的出海奋斗史