玩酷网

激励推理实现11.7%性能提升腾讯优图破解LLM复杂指令处理难题现有的语言大模型

2025-06-23 18:14:34 量子位看科技科技

激励推理实现11.7%性能提升腾讯优图破解LLM复杂指令处理难题

现有的语言大模型（LLMs）在复杂指令下的理解和执行能力仍需提升。

腾讯优图（UTU）研究团队提出一种系统性方法——激励推理（Incentivizing Reasoning )，来提升LLM处理复杂指令的能力。

结果显示，该方法能够有效提升大多数LLM进行复杂

阅读：0 点赞：0