今日推介(第1688期):机器学习误差最小化即为范畴论Kan扩展、用过程监督优化推理和搜索Agent、通过自动奖励建模和规划扩展自主Agent、推理时扩展的高效树搜索、通过对注意头的对比学习实现长上下文多文档注意力聚焦、LLM 如何在上下文进行双跳推理 公·众·号:爱可可爱生活 爱可可 AI 前沿推介(2.21) #机器学习##人工智能##论文#