看遍北京車展里里外外,叩響自動駕駛的大門,目前方法貌似只有一個:
世界模型+強化學習。
華為乾崑智駕ADS 5、Momenta R7、輕舟乘風Max,這三套北京車展期間發布的方案,無一例外,均搭載了這一技術組合。
華為車BU CEO靳玉志,表示ADS 5是面向“自動駕駛”的解決方案;Momenta官方表示物理AI正從理念走向量產。
輕舟智能CEO于騫直接斷言,世界模型+強化學習是通向物理AI的必經之路。
車展舞臺之外,世界模型+強化學習的身影也已無處不在。
蔚來早在2年前就推出了世界模型;地平線的HSD融合了這一技術方案。
小鵬第二代VLA、理想的MindVLA,盡管與世界模型之間存在路線分歧,但這二者的云端訓練,仍然依托于世界模型+強化學習。
各家廠商的想法分歧仍在,但行動卻十分統一,目標更是一致宏大:
自動駕駛猶嫌不足,要沖線物理AI終局。
那么這篇文章,我們就跟大家聊聊,世界模型+強化學習到底是什么?
看懂世界
經過了近兩年輔助駕駛方案的迅速迭代和普及下放,L2的體驗目前正在迅速趨同。
從這次北京車展就能看出,各價位車型的輔助駕駛能力都變得越發全面。
即便是七八萬的零跑A10,也搭載了激光雷達,支持車位到車位級的輔助駕駛。
至于城區領航、高速領航,如今更是遍地開花。
但能用與好用之間,仍有巨大鴻溝。
而填平這道巨大鴻溝的關鍵,就在于補齊系統對場景的理解與能力。
這二者就恰恰決定了輔助駕駛是只能對當下做出被動反應,還是能像人類一樣預判未來、提前布局。
我們自己在駕駛時,也并非只盯著眼前的路況機械應對。
越是駕駛經驗豐富,越知道要時刻觀察周圍環境的動態,在心中推演未來幾秒可能發生的狀況,并提前做出防御性動作。
比如前方有很多胡同口,人類駕駛員自然就會減速行駛,以防胡同里忽然竄出打鬧的小孩、騎著三輪車的老人......
這才是合理的駕駛狀態,輔助駕駛依托世界模型,也正在朝這個方向進化。
不過,要合理的預測,系統首先必須真正掌握這個世界的運行規律,看透各種因果關系。
譬如在高速上,當看到前方剎車燈亮成一片時,你就自然猜想到可能出現交通事故了,然后提前剎車、打起精神觀察周圍路況,甚至打開雙閃,提醒后方車輛及早剎車。
正是基于這種內含上下文因果關系的邏輯,世界模型在云端根據真實的物理規律進行仿真訓練,才讓系統更清晰、更本質地理解人類世界的運行法則。
與此同時,世界模型也能彌補采集數據工作的不足。
因為有些場景全憑現場采集的話,隨機性太強了,比如鬼探頭、一些極端天氣,而世界模型則可以在虛擬環境中生成這種場景,然后進行針對性的訓練。
理解世界規律,只是第一步,如何讓系統基于這種理解,做出最優的駕駛決策?這就輪到強化學習登場了。
強化學習你可以把它理解成一套獎勵機制,做得符合設計目標了就有獎勵,不符合就得接受懲罰。
久而久之,系統自己就摸索出了一套最優駕駛策略,而不是簡單機械地模仿人類司機的操作。
由此,世界模型和強化學習就構建出了一個更完整的訓練閉環:
前者提供還原物理世界的訓練場,后者則讓系統日以繼夜的瘋狂特訓,把實際問題前置,把駕駛經驗攢足。
這就是世界模型+強化學習的價值,相當于給車裝了一顆“人腦”,它讓輔助駕駛真正去理解現實世界的運行規律,最終實現自動駕駛。
而這套方案其實也并不局限于自動駕駛,本質上,世界模型+強化學習就是在教機器如何去看懂世界,汽車只是最快的量產載體。
跟FSD比誰更強?
北京車展上,Momenta將“矛頭”直指特斯拉。
Momenta CEO曹旭東在群訪上對我們直言,Momenta R7這套基于世界模型+強化學習的解決方案,對標的就是特斯拉FSD V14,目標是為中國年輕人造一臺屬于他們的特斯拉。
如今,特斯拉FSD雖尚未真正進入中國市場,但它卻仿佛已經成為中國智駕玩家的“公敵”。
幾乎每一個中國智駕玩家,都在以超越FSD為己任,渴望在這場技術競賽中證明自己。
事實上,特斯拉FSD與世界模型之間也有著千絲萬縷的聯系。
去年10月,特斯拉正式官宣了神經網絡世界模擬器。
它基于真實道路采集的海量數據,在云端重建了一個遵循物理規律的虛擬世界,不僅能預測未來幾秒內環境的動態演化,還能提前評估每一種駕駛動作可能帶來的后果。
對于那些現實中極難采集的長尾場景,比如暴雪中的山路、突發事故后的混亂路口,神經網絡世界模擬器也可以主動生成,進而虛擬世界中反復特訓。

這與世界模型+強化學習的技術邏輯,幾乎如出一轍。
特斯拉的這一技術方案將同時服務于自動駕駛和人形機器人,換句話說,世界模型+強化學習也是特斯拉走向物理AI的橋梁。
從技術范式上看,特斯拉與中國主流玩家之間并不存在方向性的差異。
至于孰強孰弱,真正的分野恐怕就在于工程落地能力。
誰的模型推理延遲更低?誰的博弈能力更強?誰更能應對小概率的長尾場景?
盡管都已經開始聊終局了,但面向自動駕駛和物理AI的工程落地競賽,或許才剛剛拉開帷幕。
寫在最后
技術需要天馬行空,同時也更需要腳踏實地。
物理AI終局很美好,但它最終需要建構在資金、人才和商業閉環等基礎上,這注定只是少數強者的游戲。
對于各大AI玩家來說,跋山涉水這么多年,面對愈發宏大的藍圖,殘酷競爭仍然遠沒有結束。
如今,在世界模型+強化學習的驅使下,他們正在同一條賽道上,奔向同一個終點。
而在緊張刺激的角逐之中,我們所有人好像也都成為了這些強者游戲的一環,生活或將因為自動駕駛、物理AI發生巨大的變化。
最終,當物理AI從理念變成現實,我們也不僅僅會迎來更聰明的汽車,還將處在一個更智慧的、被重新定義的物理AI世界。
人在其中又該或者又能扮演什么角色,更是一個值得討論的命題。