4月14日,據(jù)晚點AUTO報道,小鵬汽車通用智能中心負責人劉先明在接受采 訪時披露了第二代VLA(視覺-語言-動作)模型的技術(shù)路線。他摒棄傳統(tǒng)“規(guī)則+語言翻譯”的智駕架構(gòu),自研基座模型,實現(xiàn)傳感器信息直接輸出駕駛動作,中間不再經(jīng)過語言模塊翻譯。劉先明稱之為“拆掉Language”,認為此舉能大幅降低延遲、提升實時性,更接近人類直覺行為。
劉先明表示他是小鵬“花錢最多的人”,2025年其業(yè)務(wù)占45億元AI研發(fā)預(yù)算的最大份額。何小鵬曾坦言“每月花3個億,心里很慌”。劉先明與何小鵬立下賭約:2026年8月底若未達到特斯拉FSD V14在硅谷的水平,他將在金門大橋裸跑。測試中團隊曾想用規(guī)則快速修補問題,但劉先明堅持“0規(guī)則、純數(shù)據(jù)驅(qū)動”,認為規(guī)則會限制模型上限、掩蓋真實問題,轉(zhuǎn)而依靠大規(guī)模高質(zhì)量數(shù)據(jù)、強化學習和世界模型(“腦內(nèi)小劇場”)解決難題。目前小鵬VLA 2.0已實現(xiàn)從喀什到上海5000公里橫穿中國,純視覺方案單次最長0接管里程1360公里。
劉先明認為自動駕駛只是起點,小鵬真正押注的是物理AI(包含機器人、通用智能),VLA 2.0架構(gòu)為L4而生。其核心優(yōu)勢不是炫酷模型結(jié)構(gòu),而是極致的工程化迭代速度,他曾將GPU利用率從8%提升至40%,效率翻5倍。他給自己的VLA 2.0打6分,稱“離理想還有差距”。劉先明此前在Cruise從事L4 Robotaxi研究,受Sam Altman介紹ChatGPT的震撼后,堅信大模型+規(guī)模法則可應(yīng)用于自動駕駛,2024年初加入小鵬,現(xiàn)為通用智能中心負責人。

CONTACT US
ICC APP