本文提出了一个用于训练语言Agent解决复杂科学任务的框架,通过语言决策过程(LDP)形式化任务,利用随机计算图(SCG)建模Agent,并借助Aviary环境进行训练,结果表明,通过专家迭代和推理时计算量缩放,开源小模型在特定任务上的性能可以媲美甚至超越人类专家和前沿大模型,且推理成本大幅降低,揭示了在资源受限情况下高效构建高性能语言Agent的可能性。 [LG]《Aviary: training language agents on challenging scientific tasks》S Narayanan, J D. Braza, R Griffiths, M Ponnapati... [FutureHouse Inc.] (2024) 网页链接 #机器学习##人工智能##论文##AI创造营#