汽车头条 - 李想：只有成为生产工具，才是人工智能真正的爆发时刻

当前位置：首页正文

李想：只有成为生产工具，才是人工智能真正的爆发时刻

汽车数落 9217浏览 2025-05-12 11:22:14

用手机看

手机扫码看

或许是对话的效果确实不错，又或许关于人工智能的话题意犹未尽，在去年末“AI Talk”第一季仅仅4个多月后，理想于5月7日启动了“AI Talk”第二季，李想再次向公众敞开心扉，分享了他对人工智能的最新思考，而这次的主角就是理想VLA司机大模型。

“VLA”，是“Vision-Language-Action”首字母的缩写。VLA模型即“视觉语言动作模型”，就是结合视觉、语言和动作三个模块，能够更好地理解复杂的交通场景，并做出拟人化的驾驶决策。VLA模型是人工智能技术自动驾驶领域的一种全新的技术范式。

值得特别注意的是，此次理想将其VLA大模型加了个定语“司机”。对此，李想认为，AI分为信息工具、辅助工具和生产工具三个层级，而“判断Agent（智能体）是否真正智能，关键在于它是否成为生产工具”，“只有当人工智能变成生产工具，才是其真正爆发的时刻。就像人类会雇佣司机，人工智能技术最终也会承担类似职责，成为真正的生产工具。”

在李想看来，目前的L2、L2+驾驶辅助仍属于辅助工具阶段，而VLA则能够让AI真正成为司机，成为交通领域的专业生产工具。因此，未来的VLA就是“一个像人类司机一样工作的司机大模型”。

当然，VLA的实现不是突变的过程，是进化的过程。譬如此前依赖规则算法和高精地图的辅助驾驶类似“昆虫动物智能”，当前应用的端到端+VLM辅助驾驶类似“哺乳动物智能”，在处理复杂交通问题时均存在一定局限。而VLA司机大模型才真正进入“人类智能”阶段。届时，VLA司机大模型将以“司机Agent（智能体）”的产品形态呈现，用户可通过自然语言与司机Agent沟通，跟人类司机怎么说，就跟司机Agent怎么说。

李想认为，除了提升专业能力，VLA司机大模型还需解决安全性和模型黑盒的问题。“判断司机Agent是否是个好司机，有三个关键标准：专业能力、职业能力和构建信任的能力。”

李想特别强调自研，譬如在辅助驾驶方面，英伟达Orin-X芯片无法直接运行语言模型，而理想汽车通过自研底层推理引擎，使芯片可通过INT4量化的方式运行VLM，同时凭借芯片、控制器设计和自研汽车操作系统等综合能力，理想汽车实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。“人工智能时代，扎实的基本功比走捷径重要。”

李想非常感谢因为DeepSeek的开源，让理想汽车VLA司机大模型的语言能力研发提速显著，因此，李想决定将其自研的汽车操作系统“理想星环OS”开源，以回馈社会。

而面对AI的发展，李想认为，在AI面前“所有的人性都应被保留，无论好坏”，“因为一切人性都是文化、生命、性格、能力的特质，也是人类真正的生命力所在。”

第三只眼

从去年的破50万辆销量，到今年4月初L系列的破百万辆交付，理想汽车不断创造中国高端汽车新势力成长的传奇，不仅在于其对消费者的深刻洞察，更在于其始终坚持技术创新。如今，理想汽车已俨然成为令人尊敬的企业。虽然当前辅助驾驶受到的争议颇多，但人工智能的浪潮奔涌向前终将爆发，而L3及L4自动驾驶才将很快迎来破茧的时刻，让我们这一天的到来。