本文反直觉地揭示了过度扩展思维链长度会损害 LLM 推理性能,并创新性地提出了思考最优扩展 (TOPS) 策略,通过让模型自适应选择最短正确答案进行自提升,实现了效率与效果兼顾的 LLM 推理时计算扩展,为提升 LLM 的智能推理能力提供了新思路。 [CL]《Towards Thinking-Optimal Scaling of Test-Time Compute for LLM Reasoning》W Yang, S Ma, Y Lin, F Wei [Microsoft Research, Asia & Renmin University of China] (2025) 网页链接 #机器学习##人工智能##论文##AI创造营#