玩酷网

标签: 李想

李想在思考什么?聊聊对理想VLA的看法...1、李想对于VLA(视觉语言

李想在思考什么?聊聊对理想VLA的看法...1、李想对于VLA(视觉语言

李想在思考什么?聊聊对理想VLA的看法...1、李想对于VLA(视觉语言行为)的预判,比很多人坚决且大胆。甚至可以追溯理想对这次改款的信心,不在车本身,而是更注重主动安全和基于VLA的Thor-U智能版的换新。研读了李想昨天的对话,发现李想本人对于AI的理解,并不是浅知识性,而是从知识储备、公司策略到组织上的一系列构建。对AI内部从讨论、研究再到开发,最后看到产品价值点到推进上市。所以今晚L系列的发布也是一个重要的拐点。昨天李想聊到的VLA,很多理论也跟当时周光跟我分享判断基本一致。我惊讶于李想对于非常强的学习能力外,还有他对整个组织的影响。从DS春节出来后,李想就开始讨论如何在DS开源基础上优化上自己的VLA,就是端到端的多模态化。无论是理想CTO谢炎、理想基座模型负责人陈伟等都在春节的讨论中,甚至让原本计划9月发布的VLA,比预期还要更快。其次在VLA训练中,理想的基座模型并不是做通用模型,所以是把VL也就是视觉、语言一起训练,这里面的视觉(V)需要特殊的基于行车环境的3D以及高清2D图像,车端上的行为(A)也要有更专业的汽车领域的数据和知识,这也是理想做基座模型的原因,因为不可替代。2、行业并不会存在通用的智能体。这个逻辑和周光当时聊天的观点基本一致。周光认为AI从一开始的初级专才(L2)到通才,最后会到高级专才(L5)转变。而这个专才就是能够针对自动驾驶开发的智能体,也无可替代。因为整个行业不会出现一个通用的Agent(智能体),啥都懂啥都干还都干得好。因为不同行业里的VLA,里面的V、L和A(视觉、语言和行为)都不一样。而元戎除了部署L2也尝试在做上了RoadAGI,也就是不仅在道路上的汽车,而是开发外卖、小车等移动机器人,这是未来通向高级专才的渠道之一。而理想要做的改变是怎么让AI真在实现用户价值。这个能力的核心,是从一个信息工具变成一个生产工具的转变,这是和用户构建信任的基础,也称之为司机大模型的原因。3、VLA会变成一个竞争围墙。两个人的判断出奇一致,规则时代做不好的人就做不好端到端,端到端做不好的人更做不了VLA。所以VLA的出现不是一个技术切换,或者能迅速追平的技术。因为VLA要有一个更强大定义的基座模型、数据理解、又有预训练能力,强化学习各系列能力,还要如何把蒸馏后的模型塞进不富裕的算力芯片里。研发上是一个体系,而不是一套算法。同时研发上也变成一个组织协同,而不是某位算法大佬主导一整个革命的时代。其次是体验的围墙,VLA核心体验就是拟人化。VLA大家开始普及后,其中的A带来的体验也会有巨大的差异。其次通过强化学习等手段,VLA的安全模型也能够对应的提升。最后是持久战,VLA更重视积累。第一阶段大家拼的场景,从高速、城区、车位到车位等场景,但VLA拼的都是AI体系、技术积累,组织协同和长期投入。这里和大家分享一段李想的回答:什么是智慧呢?智慧就是我们跟万物的接触。如果你没有去过森林,没有在森林里,认真地玩儿、住过几天,那你可能觉得木头就是做筷子的,就是做纸的,就是做桌子的,而并不是意味着它是一个生命,它是跟我们不同的生命,对吧?你没有跟孩子在一起长时间的生活体验,没有跟他们一起去玩,你就没法真正地去理解孩子。那什么是智慧?我觉得智慧就是我们和万物的关系。但是怎么去提升我跟万物的关系?首先要有足够的时间跟万物去接触。所以我在讲的一个很重要的一个问题,就是今天我们很卷,但这是恰恰是真正的人工智能的意义...理想AITalk第二季理想汽车
李想创办了两家上市公司,第一家是汽车之家,市值700亿,第二家是理想汽车,市值2

李想创办了两家上市公司,第一家是汽车之家,市值700亿,第二家是理想汽车,市值2

李想创办了两家上市公司,第一家是汽车之家,市值700亿,第二家是理想汽车,市值2000亿。理想汽车有钱的很,现金储备1000多亿,而且他们只搞汽车,比搞百货的小米储备金还多。有网友表示:小米市值万亿啊,不是一个体量的,比李想有钱多了。如果只说车企,最有钱身价最高的是吉利老总,第二才是BYD老总。理想是怎么有脸跟小米比的?单论汽车,小米su7一款车比理想所有车加一块销量都高。而且供应商都喜欢给小米供货,只要质量没问题,付款从来不拖欠。大家怎么看呢?
理想AITalk第二季李想说特斯拉实测目前使用的FSD12.5之前的模型并

理想AITalk第二季李想说特斯拉实测目前使用的FSD12.5之前的模型并

理想AITalk第二季李想说特斯拉实测目前使用的FSD12.5之前的模型并非其真实能力,而FSD13.0之后的能力则非常强,显示出特斯拉在感知距离、运行帧率和车辆控制稳定性方面的扎实基本功。但特斯拉FSD落地的确实是V13.2.6,只是没有本地数据的训练出现了很多问题,不过李想认为特斯拉基本功特别扎实,尤其是在AI时代,基本功更是不可跳跃的
从造车到“造”司机:李想转做AI研究员,理想汽车不专心做车了?

从造车到“造”司机:李想转做AI研究员,理想汽车不专心做车了?

5月7日晚,李想公布了理想汽车近期在AI领域的进展。他表示,在自动驾驶层面,公司正借助AI技术实现从端到端+VLM(视觉语言模型),迈入VLA(视觉语言行动模型)的阶段,同时也正通过最新的VLA模型推动自动驾驶技术迈向更高台阶...
【理想AlTalk第二季李想面对面五关于VLA会是否是终极架构的讨

【理想AlTalk第二季李想面对面五关于VLA会是否是终极架构的讨

【理想AlTalk第二季李想面对面五关于VLA会是否是终极架构的讨论】1.什么样的cornercase(长尾案例)是可能端到端加VLM(视觉语言模型)架构无法解决,而VLA(视觉语言行动模型)是可以解决的?-我觉得有两个。第一个问题是它对复杂东西的理解,比如这有一个复杂的修路,如果是规则算法可能就会撞上,如果是端到端可能停下来,但它不知道该怎么干了。如果是VLA(司机大模型)就能轻松解决,而且我不需要有真实的场景,甚至我可以直接生成,然后来数据来进行训练,因为它能够有理解能力了,它并不是只是看到一个景象,就做出一个结果。哪怕最开始这个场景没有办法处理,但我保证三天之内相关的这种场景都能处理,因为我可以拿这东西来生成数据,来进行训练。还有很难的一点是跟人沟通。比如说我们会经常遇到一个在一条路上三条道,最右侧的车道是公交车道,然后又是限行,但是公交车道长久没有维护了,那个印刷已经不清楚了,所以它就会在那跑,虽然你可以通过一个调整说,回到中间车道,但它过一阵又跑到那条车道上去了。如果是人类有了Agent(智能体)以后,我可以跟一个Agent讲,接下来这条道路一直在中间行驶,直到它在导航的时候走了下一个。包含如果跟导航错失了以后,端到端就不知该怎么办了,但是VLA(司机大模型)在小区里可以漫游。在一个开放空间里,它可以先处理完以后,最后再跟导航调整以后的进行汇合,它跟人类完全一样的了。只是今天可能它作为一个人类,能力还没那么强,还有一个成长的过程。2.今年都会是这个状态吗?-还是看整个训练的一个进度,但它泛化能力是完全不在一个量级上了。3.VLA(视觉语言行动模型)是终极的架构吗?还不会有新的架构?-我自己认为VLA(司机大模型)能够解决到全自动驾驶。但是VLA(司机大模型)是否是一个效率最高的方式?是否有效率更高的架构出现?我打个问号,我认为大概率还是会有的。因为VLA(司机大模型)还是基于Transformer,那Transformer是不是一个效率最高的一个架构?我觉得这个其实后边不知道。4.在你看来,它是现阶段效率最高的架构?-我觉得它是能力最强的架构。因为现在能力差距太大了,今天辅助驾驶的这些规则算法、端到端跟人类差距还是太大了。然后我觉得它是最接近人类的,甚至有机会超过人类能力的一种。那它是不是效率最高的方式?其实是打个问号,因为它今天对算力的要求还是很高的。5.VLA(司机大模型)跟最后可能形成的最终大统一模型的关系是什么?-我觉得还是会有一个效率的问题,我的意思是,我们虽然有模型,但我们从来不放弃工具,因为工具是增加确定性和提高效率的。我还是举一个清晰的一个例子,因为团队很多时候太想用模型解决一切问题,那这时候就会出现类似一个现象,比如今天当然VLA(司机大模型)解决很好了,其实我们在使用VLM在解决ETC时候并不好。因为VLM(视觉语言模型)对于位置的判断是很糟糕的,所以它如果是两到三个ETC,然后我怎么进入其实非常容易判断,其实就是这个左中右。但如果像京承高速这样的机场高速那样的十几个ETC,它很多时候就不知道怎么处理了,就开始非常混乱了。我们团队太希望用模型去解决问题,就是说不停地去给VLM(视觉语言模型)喂更多的语料,更多的东西,其实都没有解决这个问题,因为这是VLM(视觉语言模型)的那个架构问题。然后我跟团队说,那解决ETC为什么不能用规则算法?因为最多的也有15个口,对吧?15个口对于你们而言,写一个程序基本上一周之内就能完成,甚至三天就能完成。然后以及我们的准确性更高,所以它就是个好东西,它就是个工具。然后如果是一个确定性的,能够拿规则去解决的,其实它意味着更低的能量消耗、更低的算力消耗和更高的准确性。那我觉得为什么不用?所以团队很快就把问题解决了,我们在ETC就非常的稳了。其实一周都不到就解决了,过去的时候解决了三四个月都解决不了的,成本很高的方式解决不了的。所以我说就是我觉得真正往下去落的时候,很多时候还是要考虑效率,就是今天DeepSeek之所以受到全世界的瞩目,很重要的一个原因还是因为它的效率变得更高了。6.特斯拉FSD真实的进入了中国,对你有没有什么影响?-我们自己一个判断和从实测过来的话,他们大概在用12.5之前的模型,并不是特斯拉真实能力,距离特斯拉真实能力还有巨大的差距。特斯拉13.0以后的能力还是非常强的。而且12.5之前的话应该是这个半规则算法的能力。所以我说不是特斯拉真实能力的体现,但是我们能看到特斯拉基本功是非常扎实的。它的整个的感知的距离,它整个运行的帧率,它整个的车辆的整个的控制的稳定性。7.为什么(特斯拉)没有释放真实的能力?-我觉得如果直接上端到端的话,有中国的这些路况,其实就像我讲的,它在美国没有学习到这些东西,然后再遇到这些复杂的,还是会遇到挑战。8.你们现在还学特斯拉吗?最近从他身上学到了什么?-我觉得美国的很多的顶级的公司,像苹果,像特斯拉这种企业,就是他们基本功特别扎实。我觉得这个是我们真正要去学的,尤其是在今天这种内卷的环境下,包括外部的不确定的环境下,这时候更是每个企业扎扎实实练基本功的最好的时候。而且到了人工智能时代的话,基本功就更是不可跳跃的。所以我觉得如果很多企业做了很多的创新,但是没有基本功,不扎实,很多创新就会昙花一现就过去了,所以这会是很大的问题。因为它虽然拥有很多钱,能发明了很多东西,就创造、创新了一些很多的功能的组合。但是你会发现能力强的公司复制的东西基本上在人工智能时代都是按周计算就能复制过来,所以那个能力的基本功还是非常重要的。9.为什么是学苹果呢?-我觉得最重要的是学能力。我们在小的时候没有看明白,没有看懂苹果,这个阶段的时候我们可能又去认真研究苹果,发现它还有很多能力其实值得我们去学习的。到今天为止,当你做到千亿收入,你再去看这种万亿收入公司的能力的时候,你开始模模糊糊能看懂一些了。但是我们小的时候,我们很小规模的时候,我们看不懂苹果为什么这么做。我觉得最后其实是规模,因为规模是一个可以确定衡量的变化,也会带来用户规模和用户需求的变化,技术和产品的变化,也会带来组织和能力的变化。10.你有试驾过上了VLA(司机大模型)的车吗?有经历过什么ahamoment(惊喜时刻)吗?-我觉得挺难有什么ahamoment(惊喜时刻),因为你已经理解它的原理了,其实就是它就变得跟人很像了。它变成更像人其实没什么惊奇的。相反一个动物忽然会的一些东西,你觉得挺惊讶,但一个人做好东西,你认为其实是正常的。11.你之前对内说过理想的智驾原创性超过了增程,这句话是不是太自信了?-我自己觉得我们在这方面的研究工作真的做得很深。你看到我们的各种的论文,而且我们为了做好辅助驾驶,我们还做了操作系统。然后我们为了做辅助驾驶,我们构建了完整的训练体系,我们为了做辅助驾驶,甚至我们自己去直接去改芯片,我们做了很多这方面的工作。那这方面工作肯定做的比增程更多,然后我觉得还有一个比较好的一个评价方式。就是我们历史上从来没有遇到过,然后任何一个周期,比如2024年和2025今年年初,我们每一个辅助驾驶团队的核心人员可能基本上都会接到20个以上的猎头电话。理想AITalk第二季李想说当前竞争环境下要练基本功
理想AITalk第二季李想谈辅助驾驶到了新十字路口晚上全程看完了第二季,李想重

理想AITalk第二季李想谈辅助驾驶到了新十字路口晚上全程看完了第二季,李想重

理想AITalk第二季李想谈辅助驾驶到了新十字路口晚上全程看完了第二季,李想重点分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。李想将AI工具分为三个层级,分别是信息工具、辅助工具和生产工具。目前,大多数人将AI作为信息工具使用,但信息工具常伴随大量无效信息、无效结果和无效结论,仅具参考价值。成为辅助工具后,AI可以提升效率,例如现在的辅助驾驶,但仍需人类参与。未来,AI发展为生产工具后,将能独立完成专业任务,显著提升效率与质量。以上是原文,试着理解总结了一下,在AI赛道上还是有很大空间去提升辅助驾驶的能力,未来汽车只是一个载体,AI是核心!李想说当前竞争环境下要练基本功
理想汽车CEO李想谈梁文锋:特别自律,能跟人性的懒惰和走捷径做对抗

理想汽车CEO李想谈梁文锋:特别自律,能跟人性的懒惰和走捷径做对抗

新浪科技讯5月7日晚间消息,今晚在《理想ATalk第二季》节目中,当谈及“怎么看梁文锋”的话题时,理想汽车CEO李想表示:我只跟他聊过一次,是去年的九月份,印象特别深,应该是ChatGPT-o1发布前几天,我自己个人感觉他有两个...
问:你有没有想过DeepSeek为什么不是你做的?李想:-我觉得我只能做最好的

问:你有没有想过DeepSeek为什么不是你做的?李想:-我觉得我只能做最好的

问:你有没有想过DeepSeek为什么不是你做的?李想:-我觉得我只能做最好的自己。我的人生经历,我进入了汽车行业,我做汽车的网站,我其实一直在自己的长板的延长线上继续来做。从最开始做个人网站,到做产品的IT网站,到做汽车网站,最后希望能够改变汽车行业,推出更好的产品,汽车叠加下一代的信息技术。-这个其实是我的一个延长线。他(梁文锋DeepSeek创始人)的延长线其实就是从人工智能开始的,他在浙大学的就是人工智能,那是他的延长线,本身我也相信,量化交易的公司,对于整个模型的能力,对模型的理解,对于本身工程的能力,不会比任何互联网公司差,甚至可能还要更强。308_IO理想汽车新能源汽车
理想AITalk第二季距离第一季AITalk过去了130多天,人工智能的世界

理想AITalk第二季距离第一季AITalk过去了130多天,人工智能的世界

理想AITalk第二季距离第一季AITalk过去了130多天,人工智能的世界翻天覆地。我和理想CEO李想决定,再坐下来聊聊对AI的观察。这里是AITalk第二季。开始认真坐下听讲了第一季的时候,听了很多听不懂的但同时也产生出了很多的感兴趣的这非常重要​​​
李想年薪6.39亿?理想汽车回应“天价薪酬”拿到需倒贴2.3亿

李想年薪6.39亿?理想汽车回应“天价薪酬”拿到需倒贴2.3亿

5月7日上午,微博话题#李想年薪6.39亿#冲上热搜,“天价年薪”引发网友热议。据界面新闻报道,5月6日消息,经理人杂志梳理部分车企年报发现,在新势力车企中,管理层薪资总额最高的是理想汽车,董事长李想年薪为6.39亿元,一...