本文提出了 Mixture-of-Mamba,一种新的模态感知稀疏状态空间模型,通过解耦 Mamba 模块的投影组件并针对不同模态应用特定权重,在保持计算效率的同时显著提升了多模态建模的性能,并揭示了组件联合解耦的协同效应,为多模态模型的效率提升提供了一种有效且通用的方法。 [LG]《Mixture-of-Mamba: Enhancing Multi-Modal State-Space Models with Modality-Aware Sparsity》W Liang, J Shen, G Zhang, N Dong... [Stanford University & CMU] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#