昨天看DeepSeek r1模型的技术报告，其中有个非常有意思的点... 在R1

2025-02-24 21:33:21 嘉敏说科技科技

昨天看DeepSeek r1模型的技术报告，其中有个非常有意思的点... 在R1思维过程中他会自动使用多种语言进行思考。

虽然使用多种语言进行思考对于模型来说是有好处，但对于做校正的工作人员来说是有困难的，所以限制模型在一段思考中只使用一种语言。加上这个限制之后大模型的能力稍微的降低了。