汽车头条App
汽车头条公众号
当前位置: 首页 正文
或许是对话的效果确实不错,又或许关于人工智能的话题意犹未尽,在去年末“AI Talk”第一季仅仅4个多月后,理想于5月7日启动了“AI Talk”第二季,李想再次向公众敞开心扉,分享了他对人工智能的最新思考,而这次的主角就是理想VLA司机大模型。
“VLA”,是“Vision-Language-Action”首字母的缩写。VLA模型即“视觉语言动作模型”,就是结合视觉、语言和动作三个模块,能够更好地理解复杂的交通场景,并做出拟人化的驾驶决策。VLA模型是人工智能技术自动驾驶领域的一种全新的技术范式。
值得特别注意的是,此次理想将其VLA大模型加了个定语“司机”。对此,李想认为,AI分为信息工具、辅助工具和生产工具三个层级,而“判断Agent(智能体)是否真正智能,关键在于它是否成为生产工具”,“只有当人工智能变成生产工具,才是其真正爆发的时刻。就像人类会雇佣司机,人工智能技术最终也会承担类似职责,成为真正的生产工具。”
在李想看来,目前的L2、L2+驾驶辅助仍属于辅助工具阶段,而VLA则能够让AI真正成为司机,成为交通领域的专业生产工具。因此,未来的VLA就是“一个像人类司机一样工作的司机大模型”。
当然,VLA的实现不是突变的过程,是进化的过程。譬如此前依赖规则算法和高精地图的辅助驾驶类似“昆虫动物智能”,当前应用的端到端+VLM辅助驾驶类似“哺乳动物智能”,在处理复杂交通问题时均存在一定局限。而VLA司机大模型才真正进入“人类智能”阶段。届时,VLA司机大模型将以“司机Agent(智能体)”的产品形态呈现,用户可通过自然语言与司机Agent沟通,跟人类司机怎么说,就跟司机Agent怎么说。
李想认为,除了提升专业能力,VLA司机大模型还需解决安全性和模型黑盒的问题。“判断司机Agent是否是个好司机,有三个关键标准:专业能力、职业能力和构建信任的能力。”
李想特别强调自研,譬如在辅助驾驶方面,英伟达Orin-X芯片无法直接运行语言模型,而理想汽车通过自研底层推理引擎,使芯片可通过INT4量化的方式运行VLM,同时凭借芯片、控制器设计和自研汽车操作系统等综合能力,理想汽车实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。“人工智能时代,扎实的基本功比走捷径重要。”
李想非常感谢因为DeepSeek的开源,让理想汽车VLA司机大模型的语言能力研发提速显著,因此,李想决定将其自研的汽车操作系统“理想星环OS”开源,以回馈社会。
而面对AI的发展,李想认为,在AI面前“所有的人性都应被保留,无论好坏”,“因为一切人性都是文化、生命、性格、能力的特质,也是人类真正的生命力所在。”
第三只眼
从去年的破50万辆销量,到今年4月初L系列的破百万辆交付,理想汽车不断创造中国高端汽车新势力成长的传奇,不仅在于其对消费者的深刻洞察,更在于其始终坚持技术创新。如今,理想汽车已俨然成为令人尊敬的企业。虽然当前辅助驾驶受到的争议颇多,但人工智能的浪潮奔涌向前终将爆发,而L3及L4自动驾驶才将很快迎来破茧的时刻,让我们这一天的到来。
评论 0
作者信息
更多资讯推荐