車載GPT爆紅前夜:一場巨頭競逐的游戲

HiEV大蒜粒車研所 整合編輯:龔震 發(fā)布于:2024-06-23 21:54

在基于GPT-3.5的ChatGPT問世之前,OpenAI作為深度學(xué)習(xí)領(lǐng)域并不大為人所看好的技術(shù)分支玩家,已經(jīng)在GPT這個賽道默默耕耘了七八年的時間。

好幾年的時間里,GPT始終沒有跨越從“不能用”到“能用”的奇點。轉(zhuǎn)折點發(fā)生在2020年6月份發(fā)布的GPT-3,從這一版本開始,GPT可以做比較出色的文本生成工作了,初步具備了“智慧涌現(xiàn)”能力。

再后來,OpenAI在GPT-3.5里加入了個人機交互界面,做了聊天機器人ChatGPT,迅速席卷全球,在短短的兩個月的時間里,用戶數(shù)量迅速突破1億大關(guān)。

圖片來源:英偉達

海外的谷歌、Meta、特斯拉,國內(nèi)的百度、華為、阿里、字節(jié)這些互聯(lián)網(wǎng)巨頭紛紛加碼在GPT大模型上的投入,再后來,本土電動車企形形色色的GPT也陸續(xù)問世了。

自2023年第四季度開始,問界M9上的盤古大模型、理想OTA5.0里的Mind GPT,蔚來汽車上的NOMI GPT、小鵬XOS天璣系統(tǒng)里的XGPT陸續(xù)上車,不僅幫你寫詩,還能幫你做事。

那么,這些車載GPT是如何橫空出世的,它們又將為汽車上帶來何種變化呢?

大模型上車:開源 VS 閉源

早期,沒有在大模型方面布局的本土車企是借助國內(nèi)外開源的基礎(chǔ)大模型自研GPT,這應(yīng)該也算是業(yè)內(nèi)公開的秘密。原因無他,真正自研大模型實在太消耗資源了。

大模型的賽道非常卷。為了縮短訓(xùn)練時間,且提高訓(xùn)練效率,OpenAI、谷歌、Meta這些巨頭的基礎(chǔ)大模型都是投入大幾千張甚至幾萬張A100、H100顯卡訓(xùn)練出來的。

1萬張A100大約對應(yīng)3.12E的訓(xùn)練算力。公開信息顯示,國內(nèi)頭部車企里,華為用在汽車業(yè)務(wù)上的訓(xùn)練算力3.5E,百度為2.2E,蔚小理的算力規(guī)模都在1E左右。

在一次訪談中,馬斯克透露過xAI的Grok(據(jù)說要上特斯拉的車)訓(xùn)練投入了8000張A100。從GPU小時來算,且不說這些閉源的參數(shù)量奔著萬億級別而去的大模型,即便那些開源大模型,其消耗的GPU資源都是不可承擔(dān)之重。

據(jù)悉,Meta開源的LLaMA-2-70B的大模型,使用了2000個英偉達A100訓(xùn)練,耗費了172萬個GPU小時;地表最強開源大模型Falcon-180B,使用了4096個A100 GPU,耗費了約700萬 GPU小時進行訓(xùn)練。

來源:馬斯克訪談

無論從什么角度,不以大模型為主業(yè)的本土車企,都不可能為這個賽道投入這么巨大的資源,而且,幾萬張A100/H100(百億美金)遠不是這些現(xiàn)在基本上還無法盈利、只能依靠資本市場輸血的車企所能承擔(dān)的了的。

所以,采用開源大模型自研可滿足車用場景的GPT,成了本土車企的捷徑,也幾乎是唯一可行的路徑。

只有少數(shù)巨頭強勢賦能的車企,才會采用了自研基礎(chǔ)大模型的方案。比如,華為系的問界、智界和百度系的極越,真要算起來,華為的盤古大模型和百度的文心一言問世的時間也不短了。

稍許遺憾的是,這兩個大模型至今沒有產(chǎn)生破圈效應(yīng),GPT上車的時間也并沒有比蔚小理早很多。

這背后有一系列復(fù)雜的原因。

一方面,正如華為高管在2023年的華為開發(fā)者大會上所說的那樣,“我們的大模型不做詩,只做事”,因為一直做著to B的生意,沒有to C,所以沒有被大眾所熟知。

另一方面,盤古大模型和文心一言之前基礎(chǔ)能力不足,基礎(chǔ)能力的不足來自于參數(shù)規(guī)模比較小、訓(xùn)練數(shù)據(jù)和訓(xùn)練時間不足。

必須承認,直到OpenAI的ChatGPT問世之后,整個行業(yè)及業(yè)界專家才真正接受了比例定律Scaling Law,建立了可以通過擴大模型規(guī)模、增加訓(xùn)練數(shù)據(jù)量、延長訓(xùn)練時間實現(xiàn)模型性能持續(xù)提升的“信仰”。

信仰不足、意見不一是之前不夠大的大模型基礎(chǔ)能力不足,從而沒有產(chǎn)生破圈效應(yīng)的重要原因。

即便認可了比例定律的第一性原理,要從千億參數(shù)邁進到萬億參數(shù),也需要對模型設(shè)計做大量的科研工作,才能解決參數(shù)數(shù)量級提升引發(fā)的梯度爆炸等一系列問題。

無論如何,雖然同是率先將大模型技術(shù)搬上汽車的第一陣營,華為(問界和智界)/百度(極越)的大模型上車路徑和蔚小理還是有著明顯的區(qū)別,其本質(zhì)的區(qū)別就在于前兩家的基礎(chǔ)大模型來自自力更生,而新勢力的基礎(chǔ)大模型很大可能來自于業(yè)界的開源方案。

專心做訓(xùn)練也是一種自研

除了參數(shù)量達到1800億的Falcon-180B(去年9月份開源),開源基礎(chǔ)大模型的參數(shù)一般都在幾百億級別。這是巨頭的游戲。

扎克伯格的Meta是開源大模型的主要貢獻者,它們開源的LLaMA-70B的參數(shù)在700億左右。

另一玩家是谷歌,也許是意識到了無法打敗OpenAI,帶著攪局或者不想讓OpenAI壟斷基礎(chǔ)大模型市場的心思,谷歌正加快開源的動作,它最近開源了兩個大模型——Gemma 2B和7B,可分別在端側(cè)和云端部署。

根據(jù)這些巨頭宣布開源大模型的時間做一個推論,蔚小理等本土車企們用的開源大模型的參數(shù)量大概在千億左右。

這些開源基礎(chǔ)大模型提供的不只是模型結(jié)構(gòu)的細節(jié),更重要的是,它們經(jīng)過了萬億Token的訓(xùn)練,模型里的權(quán)重參數(shù)已經(jīng)是完成度很高的可用狀態(tài)。對于基于開源大模型做訓(xùn)練的車企而言,要做的工作是尋找或建立能夠適用于車用場景的數(shù)據(jù)集,再進行微調(diào)訓(xùn)練。

在開源基礎(chǔ)大模型上面做定制,從而訓(xùn)練出微調(diào)大模型的過程,就好比學(xué)霸上完了高中,并將他腦袋里成熟的神經(jīng)網(wǎng)絡(luò)復(fù)刻到你的腦袋里,然后你再去上大學(xué)選個專業(yè),在這個專業(yè)領(lǐng)域單兵突進,繼續(xù)深造。

比如,現(xiàn)在有專門面向醫(yī)療行業(yè)、財稅行業(yè)的大模型,同樣是在基礎(chǔ)大模型之訓(xùn)練出來的。

再比如,一小撮程序員訓(xùn)練出來志在消滅大多數(shù)程序員的軟件開發(fā)者大模型——GitHub Copilot,和最近讓碼農(nóng)們聞風(fēng)喪膽的Davin。

圖片來源:GitHub

和華為系、百度系相比,蔚小理的GPT在參數(shù)量上也許小了一個數(shù)量級,但這并不意味著NOMI GPT們在車載場景下的專項能力一定會低于華為/百度系車企,幾百億參數(shù)的大模型足以將文本形式的所有人類知識壓縮進去。

再者,加大訓(xùn)練數(shù)據(jù)規(guī)模同樣可以提升大模型的表現(xiàn),可以認為,數(shù)據(jù)集的作用并不亞于模型參數(shù)。

在2023年的微軟Build大會上,Andrej Karpathy大神在闡釋參數(shù)量和Token數(shù)量對大模型性能的影響時,對2020年問世的GPT-3和2023年問世的LLaMA-65B做過對比。

圖片來源:微軟Build大會

2020年發(fā)布的GPT-3的參數(shù)量為1750億,訓(xùn)練Token數(shù)量為3000億(隨著時間的增加,會繼續(xù)追加訓(xùn)練數(shù)據(jù)規(guī)模),LLaMA-65B的參數(shù)量為650億,用于訓(xùn)練的Token數(shù)量介于1萬億-1.4萬億之間。

GPT-3參數(shù)量更大,表現(xiàn)卻不及LLaMA-65B,背后的主要原因就在于LLaMA進行了更加充分的訓(xùn)練。

在訓(xùn)練上,其他玩家也可以站在巨人的肩膀上,向訓(xùn)練完備、表現(xiàn)出色的大模型投喂更多的訓(xùn)練語料。而且,在一定程度上,語料庫也是現(xiàn)成的。

過去幾十年,除了尋求如何設(shè)計更加可泛化的推理機制,設(shè)計可通向人類通用能力和常識的神經(jīng)網(wǎng)絡(luò)和大模型,人工智能研究人員還把大量的精力放在了孜孜不倦地構(gòu)建包含大量常識語料庫的知識庫上面。

比如,用于訓(xùn)練和評估用于檢測機器釋義文本模型的Identifying Machine-Paraphrased Plagiarism、通用文本分類數(shù)據(jù)集Wikipedia、Reddit 和 Stack Exchange、QA 數(shù)據(jù)集Quoref 、 基于文本的問答數(shù)據(jù)集TriviaQA等等。

這背后有大量的工作要做。因為,和基礎(chǔ)大模型可以通過無監(jiān)督、無需標注的數(shù)據(jù)進行訓(xùn)練不同,在基礎(chǔ)大模型之上進行微調(diào)訓(xùn)練時,需要通過有監(jiān)督和基于人類反饋的強化學(xué)習(xí)形式,在標注過的高質(zhì)量數(shù)據(jù)集上進行訓(xùn)練,通過對話形式進行專項能力訓(xùn)練,工作量也不容小覷。

圖片來源:Andrej Karpathy

大模型上車的部署路徑

大模型自有其訓(xùn)練機制,在車端的部署路徑也日益清晰。

按照難易程度和各個頭部車企的大模型上車實踐,可以做出一個比較清晰合理的判斷:大模型將全面改造智能座艙,并有望在幾年后真正部署在智能駕駛方案中。

智能座艙是人機交互集中發(fā)生的地方,人和機器或智能體的交互主要體現(xiàn)在機器對人類意圖的理解、記憶和推理三個方面,大模型天然具備超強的理解和生成能力,并可以通過提高上下文的長度增強記憶能力,再加上智能座艙的容錯能力特別強,所以,從技術(shù)和應(yīng)用場景的契合度上,大模型和智能座艙可謂天作之合,也必然大幅度提升人機交互體驗。

理想汽車在MEGA發(fā)布會上,介紹了Mind GPT的四大落地場景:百科老師、用車助手、出行助手和娛樂助手,基本總結(jié)了大模型技術(shù)當前在智能座艙領(lǐng)域的幾個用武之地。

圖片來源:理想汽車

自動駕駛領(lǐng)域也是大模型可以大顯身手的地方。

大模型對自動駕駛的意義目前主要體現(xiàn)在加快算法開發(fā)和模型迭代速度上,比如毫末智行發(fā)布的大模型DriveGPT雪湖·海若可以在“訓(xùn)練階段”進行數(shù)據(jù)的篩選、挖掘、自動標注,在“仿真階段”生成測試場景。

不過,由于自動駕駛對安全性的要求特別高,對實時性的要求也極為嚴苛,要在車端部署大模型形式的自動駕駛方案還需要很長一段時間。

業(yè)界還在探索在“開發(fā)階段”利用大模型(生成式的多模態(tài)大視覺語言模型),比如理想汽車最近和清華聯(lián)手開發(fā)的DriveVLM,部署在英偉達Orin X上的話,推理能力需要0.3秒。

0.3秒是個什么概念?就是如果你以20米每秒(對應(yīng)72公里每小時)的速度開車,0.3秒可以跑出去6米。。。這還僅僅是考慮到了實時性這個單一因素,還沒有涉及到大模型的幻覺對安全性的威脅。

所以,大模型改造智能座艙可謂指日可待,但用在自動駕駛方面,只能說任重道遠,未來可期。

總體上,面對激烈的市場競爭,本土車企不能放過任何一個風(fēng)口,大模型這種超級大的風(fēng)口絕對不能錯過,其他車企今年會陸續(xù)傳來大模型上車的消息,這一點基本上毋庸置疑。

接下來這一年,大家可能需要做好迎接各種車載大模型炫技的測評視頻滿天飛的準備,不過,也不用太理會他們說的怎么天花亂墜,大模型從“能用”到真正“好用”,再到產(chǎn)生破圈效應(yīng),諸位且耐心等一等吧。

文章來源:HiEV大蒜粒車研所

網(wǎng)友評論

聚超值•精選

最新內(nèi)容

“新”“老”奔馳,怎么繼續(xù)奔馳?

奔馳展示了其在電動化和智能化方面的創(chuàng)新成果。通過引入端到端無圖L2++全場景高階智能駕駛系統(tǒng),奔馳成功躋身行業(yè)頭部。該系統(tǒng)基于中國數(shù)據(jù)訓(xùn)練,更適應(yīng)中國路況,并提供擬人化的博弈體驗。此外,奔馳還推出了自動泊車系統(tǒng)和MB.OS全新域控制架構(gòu),在安全、設(shè)計和品質(zhì)方面保持領(lǐng)先地位。

奔馳 | 智能化
極氪收購領(lǐng)克了?別急,這只是個開始。

吉利控股集團宣布,將領(lǐng)克變?yōu)闃O氪的子公司。這一舉動是為了實現(xiàn)《臺州宣言》中的目標,優(yōu)化吉利、領(lǐng)克、沃爾沃和極氪之間的股權(quán)關(guān)系。由于極氪在領(lǐng)克股權(quán)中占據(jù)51%,因此領(lǐng)克事實上已成為極氪的子公司。合并后,兩個品牌仍然相對獨立存在,并不會影響在售車型和開發(fā)新車。售后服務(wù)也將得到改善,特別是小城市車主將更加方便。

極氪 | 領(lǐng)克
這屆廣州車展,BBA的智能化支棱起來了

BBA豪華品牌在廣州車展上推出了電動化和智能化產(chǎn)品,展現(xiàn)了新的競爭力。奧迪推出全新品牌AUDI,奔馳展示了MB.OS操作系統(tǒng)和聯(lián)邦學(xué)習(xí)技術(shù),寶馬則引入V2X技術(shù)和L2+智能駕駛輔助系統(tǒng)。這些豪華品牌開始向新勢力看齊,并加快電動化轉(zhuǎn)型進程。

BBA | 智能化
智駕闖入10萬級:小鵬造爆款,比亞迪全系“All in”

國內(nèi)10萬級新能源車型智駕功能開始普及,小鵬P7+成為首款爆款。此前高階智駕幾乎只出現(xiàn)在30萬元以上的豪華車中,而20萬元以下的新能源車型幾乎沒有配置高階智駕。然而,今年下半年以來,深藍S07、小鵬MONA M03等多款支持智駕的10萬級新能源車陸續(xù)上市。

智駕 | 10萬級
廣州車展“混戰(zhàn)”:場內(nèi)小米、華為搖旗吶喊,場外合并、重組硝煙彌漫

11月15日,廣州車展開幕。小米和華為在新能源汽車領(lǐng)域炙手可熱,小米發(fā)布了SU7 Ultra原型車并展示智能底盤技術(shù),華為推出尊界品牌。同時,合資品牌奧迪、廣汽豐田和廣汽本田也帶來了新的電動車型。自主品牌吉利幾何與銀河合并,極氪與領(lǐng)克整合。這表明中國新能源汽車市場正加速洗牌,并顯示出科技巨頭在該行業(yè)的競爭力。

廣州車展 | 新能源汽車
二維碼 回到頂部