
越是信息爆炸的时代,人们越是容易少见多怪。
这几年,我们见识过各种各样惊悚的标题,听了太多“逆天炸裂”、“碳基终结者”、“ChatGPT时刻”、“iPhone时刻”这样的暴论,但最终只有极少数产品能做到真正的金身不破,DeepSeek就是其中的一个。
问题来了,这个AI大模型能给致力于打造AI汽车的本土车企带来哪些好处呢?
01
ChatGPT已经问世将近两年半,各行各业的从业者们都已经走过了质疑AI、理解大模型、拥抱AI大模型的三个阶段。
到了DeepSeek爆火时,汽车业这种与AI强相关的行业在拥抱DeepSeek上没有展现出一丝一毫的犹豫。
毕竟,大模型一手To B,可以帮助车企提升生产力,一手To C,可以提升智能电动汽车的产品力。

根据字节跳动旗下火山引擎的总结,大模型可以改善车企的业务运营,在营销、研发、制造、物流、质量、运营各个环节降低运营成本,提升运营效率。
营销方面自不用提,大家已经见识了DeepSeek写小作文的能力,天花乱坠,舌灿莲花,有时我也被它震撼地五体投地。

研发层面,最能体现DeepSeek实力的是它的编码能力。
和之前的预训练大模型相比,GPT o1/o3和DeepSeek R1这种推理模型在代码编写能力上有了长足的进步。
必然能在去年30%自动编码、70%人工编码的基础上,进一步提升自动编码的占比。

制造方面,理想汽车25年3月份通过官方媒体表示,24年6月份经过多番评测对比后,引入当时尚未广泛流行的DeepSeek-VL 7B视觉大模型打造了行业首个 “硅基质检员”,实现了效率跃升、精度提升、柔性匹配三大突破。
至于网络上盛传的比亚迪在电池生产线上部署了基于DeepSeek的工业视觉质检方案,因为没有官媒的确认,大概率是哪个小编让DeepSeek生成的假消息。

在物流、质量、运营方面的应用案例在此就不再一一列举了。
根据DeepSeek的官方表态,它们重点发力三个方向:数学和代码、多模态、自然语言。
写小作文对应的是自然语言本身的能力,助力软件开发体现的是其代码能力,在生产线上做质检体现的是它的多模态能力。
DeepSeek押注的这三个方向和智能电动车企的需求契合度非常高,所以可以预计,车企使用DeepSeek的行为是长期可持续,绝非为了蹭一蹭热点而已。
02
万物皆可AI。近一两年来,AI PC、AI手机、AI汽车的新概念层出不穷。
有一说一,和其它很多其实并不具备强AI属性的产品相比,这三类产品的概念还是比较契合现实、中规中矩的。
目前,软件定义汽车方兴未艾,AI定义汽车山雨欲来,随着智能电动汽车AI属性的逐渐增强,AI大模型领域的翘楚DeepSeek必然将在AI汽车中找到用武之地。

第一个应用领域显然是智能座舱。
据悉,目前除了蔚来和小鹏没有通过官方消息确认在座舱系统里引入DeepSeek,其它新势力车企、传统车企、合资车企都相继官宣了DeepSeek上车的好消息。

需要指出的是,DeepSeek并非车企部署在座舱系统里的唯一大模型,而是与另外一个可以快速响应用户简单问题的预训练大模型一起双模部署。
比如零跑汽车的座舱系统同时部署了阿里巴巴的通义千问大模型和DeepSeek大模型,通义千问负责快速响应,DeepSeek负责深度思考,然后精准回答用户的复杂问题。

这种搭配的理论根源来自快慢系统。
通义千问作为系统1,依赖直觉与本能进行快速判断和高效响应,DeepSeek R1作为系统2,依赖有意识的分析思考进行复杂推理和基于规则的演绎。
可以拿理想汽车智能驾驶解决方案里的快慢双系统,和座舱系统里的双模型做类比。

鉴于R1目前的多模态能力并不是太强,对数字座舱来说,它带来的助益主要体现在语言识别后的模糊意图理解能力和文本内容生成能力上。
模糊意图理解能力上,它支持上下文关联的多轮对话,可以根据情感基调、人物关系、当下情景理解用户的模糊指令,带来了自然语言交互的跨越式升级。
文本内容生成能力上,据悉,DeepSeek在训练语料上大量使用北大中文系学子做数据标注。
其结果就是,它的文字特别优美,而且具有极强的情感穿透力。
想必很多人都曾在它的小作文面前痛哭流涕,反复念叨着知音难觅,知音难觅!
03
无利不起早,各个车企之所以迫不及待地将DeepSeek搬到座舱里,是因为它可以快速大幅度提升智能座舱系统理解用户指令并提供高质量回答的能力。
但在智驾系统上,DeepSeek还没有找到直接的用武之地。
一来,深度思考模式的DeepSeek R1先推理再回答,无法满足智能驾驶系统对实时性的要求。
二来,它的幻觉极其严重,经常理直气壮地编造数据,信誓旦旦地胡说八道,无法满足智能驾驶系统对准确性的要求。

不过,DeepSeek倒是可以在启发智驾模型训练新范式献上一臂之力。
DeepSeek的蒸馏技术路径表明,使用GPT o1等先进模型生成的高质量数据做训练,可以大幅度压缩训练阶段的算力需求。
DeepSeek可以通过强化学习生成高质量的智驾场景数据,减少对庞大车队和人工的依赖,解决数据驱动的端到端模型训练中的高质量数据缺失问题。

在提升训练效率上,DeepSeek通过DualPile双向管道并行算法和EPLB专家并行负载均衡器,实现了数据通信和计算的重叠,提高了计算资源利用率,加快了模型训练速度,并大大方方地进行了开源。
在前段时间的AI技术分享交流日上,小鹏智驾负责人李力耘展示了小鹏在提高智驾模型训练速度上的一些有益探索。
其核心攻坚点也放在了提升数据访问效率上,想必也在一定程度上借助了DeepSeek的开源成果。

除了在生产力这端提供基于强化学习的训练范式、提升数据访问效率的解决方案,在产品力这端,DeepSeek R1开源的一些技术成果也能用于提升模型的运算速度。
在三月初那次开源周活动里,DeepSeek开源了DeepGEMM矩阵乘法加速库,支持FP8精度,提升了大规模矩阵运算的效率。
其开源的3FS并行文件系统实现了高速数据存取,可同时用于AI模型的训练和推理,也能帮助提升车端模型的推理能力。
五月将至,DeepSeek R2就要问世了,想必很多车企正在翘首以盼,包括那两家至今尚未官宣支持DeepSeek的车企,别再端着了!