本文提出了高效树搜索算法 ETS,通过线性规划成本模型和语义覆盖项,在保证搜索轨迹多样性的前提下,显著优化了 LLM 树搜索过程中的 KV 缓存共享,实现了推理效率的显著提升,并揭示了 KV 缓存大小在内存受限的 LLM 推理中比 FLOPs 更为关键的效率瓶颈。 [LG]《ETS: Efficient Tree Search for Inference-Time Scaling》C Hooper, S Kim, S Moon, K Dilmen... [UC Berkeley] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#