【[65星]DoubleSparse:一种高效加速大语言模型推理的技术,通过减少内存访问,几乎不损失性能,让模型运行更快更省资源】"16-fold memory access reduction with nearly no loss" GitHub: github.com/andy-yang-1/DoubleSparse #大语言模型# #性能优化# #高效计算# #AI创造营#