首页   

【[109星]PRefLexOR:基于偏好的递归语言建模,为推理-20250226133309

爱可可-爱生活  · AI  · 17 小时前

正文

2025-02-26 13:33

【[109星]PRefLexOR:基于偏好的递归语言建模,为推理优化带来革新!亮点:1. 通过迭代推理改进,模型自主学习提升决策能力;2. 结合ORPO和DPO技术,显著提升推理质量;3. 动态生成任务和反馈,无需预生成数据集,实时适应性强】
'PRefLexOR: Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning'
GitHub: github.com/lamm-mit/PRefLexOR
#推理优化# #语言建模# #动态学习# #AI创造营#
© 2024 精读
删除内容请联系邮箱 2879853325@qq.com