//@乂熵:不公布的叫秘方,公布的才是知识。 X 网友九原客建议以后推理模型不要叫 o1-like 模型要叫 r1-like。这种RL范式也叫r1 RL 范式。既然 OpenAI 选择了保密+赚钱就得放弃名声。我觉得挺有道理的👍