玩酷网

昨天看DeepSeek r1模型的技术报告,其中有个非常有意思的点... 在R1

昨天看DeepSeek r1模型的技术报告,其中有个非常有意思的点... 在R1思维过程中他会自动使用多种语言进行思考。

虽然使用多种语言进行思考对于模型来说是有好处,但对于做校正的工作人员来说是有困难的,所以限制模型在一段思考中只使用一种语言。加上这个限制之后大模型的能力稍微的降低了。

这个问题想到人类建造巴别塔的故事,有点哲学映射在里头。同时拿这个问题去问了deepseek,他给出的回答也挺好的(参考图片)。

评论列表

听南
听南 2
2025-02-25 07:43
这么牛,反正比我牛,我答不出来