首页   

【[65星]DoubleSparse:一种高效加速大语言模型推理-20250121135302

爱可可-爱生活  · AI  · 23 小时前

正文

2025-01-21 13:53

【[65星]DoubleSparse:一种高效加速大语言模型推理的技术,通过减少内存访问,几乎不损失性能,让模型运行更快更省资源】"16-fold memory access reduction with nearly no loss" GitHub: github.com/andy-yang-1/DoubleSparse #大语言模型# #性能优化# #高效计算# #AI创造营#
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com