首页   

本文提出了高效树搜索算法 ETS,通过线性规划成本模型和语义覆盖-20250221054707

爱可可-爱生活  · AI  · 2 天前

正文

2025-02-21 05:47

本文提出了高效树搜索算法 ETS,通过线性规划成本模型和语义覆盖项,在保证搜索轨迹多样性的前提下,显著优化了 LLM 树搜索过程中的 KV 缓存共享,实现了推理效率的显著提升,并揭示了 KV 缓存大小在内存受限的 LLM 推理中比 FLOPs 更为关键的效率瓶颈。
[LG]《ETS: Efficient Tree Search for Inference-Time Scaling》C Hooper, S Kim, S Moon, K Dilmen... [UC Berkeley] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com