首页   

重磅!国产量子计算机全球首次运行AI微调大模型!

EETOP  · 硬件  · 2 周前

主要观点总结

据《新华日报》、 《科创板日报》报道,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导量子计算机“本源悟空”上成功运行十亿参数AI大模型微调任务。

关键观点总结

关键观点1: 首次运行大模型微调任务

在中国第三代自主超导量子计算机“本源悟空”上,成功运行了十亿参数的AI大模型微调任务,这是量子计算首次在真实场景下执行这样的任务。

关键观点2: 实验结果显示训练效果提升

在参数量减少76%的前提下,训练效果反而提升8.4%,验证了量子计算助力实现大模型轻量化的可行性。

关键观点3: 量子计算助力解决大模型算力焦虑

通过量子计算的特性,可以解决传统低秩微调面临的性能瓶颈和泛化能力有限的问题,为大模型微调开辟了新的路径。

关键观点4: 量子加权张量混合参数微调创新设计

团队创新设计了“量子加权张量混合参数微调”,利用量子计算特性实现智能“微调”,即将模型权重转化为量子神经网络与张量网络混合架构。

关键观点5:

“本源悟空”是中国第三代自主超导量子计算机,搭载72位自主超导量子芯片“悟空芯”,是可编程、可交付的先进量子计算机。该计算机的成功运行表明现有硬件已能初步支撑大模型微调。


正文

图片

据《新华日报》、《科创板日报》报道,记者从安徽省量子计算工程研究中心获悉,本源量子、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在中国第三代自主超导量子计算机本源悟空真机上,全球首次运行十亿参数AI大模型微调任务。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀表示:这是量子计算首次真机实战大模型任务,证明现有硬件已能初步支撑大模型微调。

实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。

微调是指在通用大模型(如 DeepSeek、Qwen)的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。传统低秩微调面临性能瓶颈、泛化能力有限等问题,量子计算凭借其叠加态和纠缠态特性可同时探索海量参数组合,可提升大模型微调的效率。

“就好比给经典模型装上了‘量子引擎’,让两者协同发力。”本源量子副总裁窦猛汉表示,团队创新设计了“量子加权张量混合参数微调”,通过量子计算特性实现智能“微调”——将模型权重转化为量子神经网络与张量网络混合架构,前者通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。

“本源悟空”的量子芯片上,单批次数据可生成数百个量子任务并行处理。实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。合肥综合性国家科学中心人工智能研究院副研究员陈昭昀补充:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”

公开信息显示,本源悟空是中国第三代自主超导量子计算机,该量子计算机搭载 72 位自主超导量子芯片“悟空芯”,是目前先进的可编程、可交付超导量子计算机。这台计算机取名“悟空”,寓意如中国传统神话人物孙悟空那样神通广大,会七十二变。2024 年 1 月 6 日 9 时,“本源悟空”在本源量子计算科技(合肥)股份有限公司上线运行。今年 2 月 14 日,中国第三代自主超导量子计算机“本源悟空”全球访问量突破 2000 万次,刷新了我国自主量子算力服务规模纪录。

来源:综合整理自《新华日报》、《科创板日报》


创芯大讲堂数字芯片课程推荐

© 2024 精读
删除内容请联系邮箱 2879853325@qq.com