首頁 > 科技要聞 > 科技> 正文

“燒光”70000億美元,與英偉達(dá)、臺(tái)積電為敵

騰訊科技 整合編輯:龔震 發(fā)布于:2024-05-19 22:47

有朋友問:Leslie,你是專業(yè)建廠出身,之前傳出山姆奧特曼要投資7萬億造芯,雖然本人不明確回應(yīng),但大媒體傳出來,一定不是空穴來風(fēng)。如果有7萬億,造劃算,還是買劃算,如果造,可能要考慮哪些方面的投入及因素?

奧特曼的“7萬億”傳聞的確是石破天驚,構(gòu)想很有意思,回答這個(gè)問題得具備豐富的半導(dǎo)體建廠,工藝,運(yùn)營(yíng)等一系列知識(shí),我們可以嘗試推算一下,如果手握7萬億美元,如何將這筆錢“合理地”花出去?

每萬片晶圓,建廠投資150億美元

首先,第一步必然是生產(chǎn)GPU邏輯芯片,這樣一來需要先蓋一座邏輯晶圓廠。我們以臺(tái)積電最先進(jìn)的2nm工廠為例,看看每萬片晶圓的資本投入情況

按投資額劃分,晶圓廠各項(xiàng)投入比例大致為:制程設(shè)備:77%,土地與建筑物:4%,潔凈室:5%,水電氣化學(xué)品等供應(yīng)系統(tǒng)設(shè)施:14%

光刻機(jī)是晶圓廠最大的制程設(shè)備投資項(xiàng)之一,占比在20%左右,而且2nm需要用到EUV光刻機(jī)(負(fù)責(zé)其中25層的光刻),成本相對(duì)更高,占比預(yù)計(jì)會(huì)提升至24%左右。

目前臺(tái)積電的2nm還是采用低數(shù)值孔徑的EUV,對(duì)應(yīng)ASML最新款的NXE:3800E,其每小時(shí)產(chǎn)出晶圓(WPH,Wafer per hour)大致在190-200片的區(qū)間,單臺(tái)設(shè)備每月產(chǎn)能預(yù)計(jì)2400片左右(具體計(jì)算見下表注釋),這意味著每萬片晶圓的產(chǎn)能,需要4臺(tái)ASML的NXE:3800 EUV光刻機(jī),而除了EUV負(fù)責(zé)的25層外,其余層還需要3臺(tái)每小時(shí)產(chǎn)出晶圓295片的NXT:2100,以及一臺(tái)KrF DUV光刻機(jī)。

*單臺(tái)設(shè)備月產(chǎn)能=每小時(shí)產(chǎn)出晶圓數(shù)*運(yùn)行時(shí)長(zhǎng)*% customer efficiency(效率)*% doseage headwind(vs.30mJ)*EUV層數(shù)*30天

按照ASML提供的數(shù)據(jù),NXE:3800E售價(jià)2億美元左右,NXT:2100i約7500萬美元,KrF DUV約1500萬美元,這意味著2nm工藝的晶圓廠,每萬片晶圓產(chǎn)能,光刻機(jī)(含維修以及備件)的投入預(yù)計(jì)在13億美元左右。

按照光刻機(jī)的投入占全部制程設(shè)備24%的比例倒推,制程設(shè)備的總投入為54億美元,而制程設(shè)備占晶圓廠全部投資額的77%,以此倒推,2nm節(jié)點(diǎn),每萬片晶圓產(chǎn)能,晶圓廠總投資額大致為71億美元。

每萬片晶圓產(chǎn)能,晶圓廠總投資額劃分,單位:美元

建完GPU邏輯芯片廠之后,還要考慮生產(chǎn)HBM的DRAM廠的建設(shè)。

我們以最先進(jìn)的1gamma制程為例,盡管DRAM的EUV光刻層有所減少,但每萬片晶圓需要的設(shè)備數(shù)量卻不降反增,尤其是刻蝕設(shè)備,整體估算下來,1gamma制程的DRAM廠投資額大概在邏輯芯片晶圓廠的總投資額的85%,即60億美元左右

補(bǔ)充說一下,DUV時(shí)代,DRAM廠的投資額大概為同級(jí)別的邏輯晶圓廠110%-120%,直到7nm節(jié)點(diǎn),邏輯廠開始大量使用EUV光刻機(jī),每萬片晶圓產(chǎn)能的投資額開始反超DRAM廠。

解決前段的GPU邏輯芯片和DRAM存儲(chǔ)芯片之后,還要解決后段的封裝問題,包括CoWoS先進(jìn)封裝、HBM封裝兩部分。

目前,最先進(jìn)的AI芯片采用的事SoIC+CoWoS封裝技術(shù),HBM4將會(huì)采用混合鍵合(Hybrid Bonding),每萬片晶圓的投資額將大幅提高至10億美元(含設(shè)備廠房)。另外,先進(jìn)封裝涉及到的中介層,也還需利用DUV構(gòu)建配套的65/45nm的前段晶圓廠,投資額為每萬片晶圓8億美元。也就是說,封裝部分,每萬片晶圓的整體投資額預(yù)計(jì)在18億美元左右。

每萬片晶圓產(chǎn)能,不同晶圓廠單位投資額,單位:美元

這個(gè)花錢的活涉及到的數(shù)據(jù)比較多,幫大家做一個(gè)小總結(jié),每萬片晶圓產(chǎn)能,或者說單位投資額,對(duì)應(yīng)2nm制程的邏輯晶圓廠、1gamma制程的DRAM廠、封裝廠(先進(jìn)封裝+中介層,10億美元+8億美元)方面的投資合計(jì)在150億美元左右

年產(chǎn)600萬顆GPU,成本500億美元

但是,GPU邏輯芯片、HBM內(nèi)存以及中介層,對(duì)應(yīng)的比例不是1:1:1的關(guān)系,所有總投資額還要在單位投資額的基礎(chǔ)上,按照系數(shù)增加,這個(gè)系數(shù)大致可以從一顆GPU,所需要的CPU、HBM內(nèi)存、中介層的數(shù)量來推算

以英偉達(dá)最新的Blackwell架構(gòu)GPUB200的Die size(814mm²)為例,每片晶圓可以切80顆芯片,按照臺(tái)積電最好的工藝,良率大致在65%左右,即每片晶圓可以切50顆Good Die。

附帶說一下,由于GPU邏輯芯片是大芯片,為了提高光刻的曝光清晰面積,物鏡成像的景深就需要控制在相對(duì)較大水平,這會(huì)導(dǎo)致分辨率降低,是缺陷變多,良率下降的重要原因。

英偉達(dá)的B200搭配了Grace CPU,2顆GPU搭配1顆Grace CPU,那么50顆GPU,需要搭配25顆CPU。按照3nm制程計(jì)算,以CPU的Die Size和良率預(yù)估,一片晶圓可以切300顆左右的CPU芯片,這意味著一片GPU晶圓,需要搭配0.08片CPU晶圓。

目前3nm節(jié)點(diǎn),每萬片晶圓的投資是2nm節(jié)點(diǎn)的70%,大致50億美元,也就是說投入71億美元生產(chǎn)10000片GPU晶圓的同時(shí),還要對(duì)應(yīng)投資71億美元×70%×0.08,即4億美元,用于CPU晶圓的生產(chǎn)。

AI芯片的另一個(gè)重頭戲即HBM,英偉達(dá)的H100、H200標(biāo)配6顆,到Blackwell架構(gòu)的B200,則采用了8顆HBM3e內(nèi)存。按照臺(tái)積電最新的路線圖,2026年,一顆GPU可以搭配12顆HBM內(nèi)存,屆時(shí)HBM的規(guī)格還將從12層堆疊的HBM3e,升級(jí)至16層堆疊的HBM4/4e。

如前文所述,2nm晶圓可以切出50顆GPU邏輯芯片,按照B200的標(biāo)準(zhǔn),每片晶圓需要搭配400顆HBM3e內(nèi)存。目前,1gamma制程的DRAM芯片,每片晶圓大概可以出1200顆DRAM顆粒,而按照85%的良率計(jì)算,最終可以得到1000顆DRAM顆粒,之后要將這些DRAM顆粒封裝成12層堆疊的HBM3e內(nèi)存。目前,封裝的良率大概在80%左右,即一片DRAM晶圓可以出1000÷12*80%,約等于70顆左右12層堆疊的HBM3e內(nèi)存。

也就是說,一片GPU晶圓,除了需要0.08片CPU晶圓,還需要5.7片DRAM晶圓。未來隨著GPU邏輯芯片搭配HBM顆粒數(shù)進(jìn)一步增加,尤其是堆疊數(shù)量從12層提升到16層,GPU:DRAM晶圓1:5.7的比例,還會(huì)進(jìn)一步擴(kuò)大。

按現(xiàn)有先進(jìn)封裝的中介層尺寸,一片晶圓可以完成15顆GPU邏輯芯片的封裝,對(duì)應(yīng)一片GPU邏輯芯片的晶圓,需要3.3片晶圓的先進(jìn)封裝。

每萬片晶圓產(chǎn)能,不同晶圓廠的建廠投資總額,單位:美元

一句話總結(jié):每10000片GPU晶圓,需要800片CPU晶圓,5.7萬片DRAM晶圓,3.3萬片中介層晶圓,3.3萬片SoIC+CoWoS先進(jìn)封裝,5.7萬片HBM封裝,對(duì)應(yīng)的投資額,即1*71+0.08*50+5.7*60+3.3*10+3.3*8+5.7*10≈476億美元。

每10000片GPU晶圓所有配套芯片的生產(chǎn)工廠需要耗費(fèi)476億美元,加上其他雜七雜八費(fèi)用直接算整數(shù)為500億美元,換算成GPU芯片數(shù)量,為每月50萬顆,一年600萬顆。

8年半可以燒完7萬億美元

投資500億美元,一年生產(chǎn)600萬顆GPU,這是個(gè)什么概念?可以根據(jù)臺(tái)積電CoWoS產(chǎn)能,來推算全世界的AI GPU的量,然后再進(jìn)行對(duì)比。

2024年,臺(tái)積電CoWoS總共31萬片的產(chǎn)能,其中95%都是給AI GPU,只有一萬多片是給Xilinx的FPGA,剩下的近30萬片被英偉達(dá)、AMD以及全球互聯(lián)網(wǎng)大廠諸如Google,AWS,Meta,Mircosoft的自研ASIC芯片瓜分。

也就是說,臺(tái)積電CoWoS產(chǎn)能代表全世界AI芯片產(chǎn)能,2024年80%的GPU還是只使用2.5D CoWoS,英偉達(dá)的H100大約是每片29顆,其他自研ASIC則都高于這個(gè)標(biāo)準(zhǔn),有的還超過40顆,目前只有AMD的MI300使用SoIC封裝,每片約為15顆。

綜合下來,今年臺(tái)積電30萬片CoWoS產(chǎn)能,對(duì)應(yīng)大約是1000萬顆GPU,這也就是2024年全球AI GPU的大致總量。前面提到,投入500億美元,每年可生產(chǎn)600萬顆GPU,也就是說,在2024年,想要生產(chǎn)滿足全世界需求的1000萬顆AI GPU,總投入需要830億美元。這個(gè)水平相當(dāng)于臺(tái)積電2-3年的資本支出,也大概是臺(tái)積電Fab20A,一座月產(chǎn)12萬片的2nm芯片工廠的總投資額。

投入830億美元,就能生產(chǎn)出2024年全世界所需要的AI芯片,想要把奧特曼的7萬億美元花完,還有很多工作要做,畢竟830億美元也僅僅是建設(shè)芯片工廠的費(fèi)用。

芯片廠、DRAM廠、封裝廠都蓋完之后,就要考慮生產(chǎn)服務(wù)器的工廠建設(shè),還得蓋許多座類似工業(yè)富聯(lián)的這樣的工廠,不過這類服務(wù)器組裝工廠與芯片工廠相比來說,只是小巫見大巫,把AI服務(wù)器所有產(chǎn)業(yè)鏈上的工廠全部建設(shè)起來,包含服務(wù)器,光模塊,液冷,銅線材,各式各樣的模具廠,年產(chǎn)1000萬顆GPU,按單個(gè)服務(wù)器8顆GPU算,即120萬臺(tái)服務(wù)器,所有下游工廠的總投資額大致為170億美元。加上上游芯片工廠的830億美元,1000億美元?jiǎng)t是2024年全球所有AI 芯片+服務(wù)器出貨量所需的工廠建設(shè)總成本。

上下游工廠建設(shè)只是開端,工藝還需要持續(xù)的研發(fā)投入,包括設(shè)計(jì)、制造相關(guān)的研發(fā)費(fèi)用,覆蓋GPU、CPU、HBM、先進(jìn)封裝等等環(huán)節(jié),這部分可以打包算一下英偉達(dá)、AMD、臺(tái)積電、SK海力士的研發(fā)總額,大致300億美元。再加上服務(wù)器硬件研發(fā)、比如光模塊、也冷等等,研發(fā)部分的費(fèi)用滿打滿算可以達(dá)到500億美元。

而對(duì)于OpenAI,在推進(jìn)AGI的路上,也需要持續(xù)的進(jìn)行模型研發(fā)投入,每年在這上面的費(fèi)用至少200億美元。

芯片部分的研發(fā)+AI部分的研發(fā),每年的總投入至少在700億美元,如果要更快入的推進(jìn),加大研發(fā)投入是必然,所有推進(jìn)AGI終極目標(biāo)的研發(fā)投入,每年估算需加大投入到1000億美元。

以上的研發(fā)費(fèi)用還不包括訓(xùn)練費(fèi)用,且訓(xùn)練需要大量的水電資源消耗,這部分基礎(chǔ)設(shè)施同樣需要自建。

歐美地區(qū)目前建設(shè)1KW核電機(jī)組的成本大約4000美元,每百萬千瓦的核電機(jī)組一年發(fā)電量約為8.6億度電,根據(jù)IEA(國(guó)際能源協(xié)會(huì))計(jì)算,2027年全球人工智能將耗費(fèi)1340億度電,所以要建設(shè)155組百萬千瓦的核能機(jī)組,這需要6000億美元左右。

根據(jù)加州大學(xué)河濱分校的研究,2027年人工智能將耗費(fèi)66億立方米的清潔淡水,大約是全英國(guó)一半的用水量,主要場(chǎng)景來自于服務(wù)器的冷卻,發(fā)電以及芯片制造這三大耗水環(huán)節(jié),建設(shè)相應(yīng)的水處理廠費(fèi)用大約為1000億美元。

相比前面的投資,制造環(huán)節(jié)的人力成本規(guī)模相對(duì)較小,重頭戲主要在芯片的設(shè)計(jì),包括模型研發(fā)部分。

前段晶圓廠把人力配置拉滿 , 每萬片約需要1000人,后段約1500人,2000萬顆GPU年產(chǎn)能的所有前段工廠(含DRAM,中介層等)大約需要2萬人,人均年芯為15萬美元,后段封裝需要3萬人,人均年薪約為7萬美元,加上5000名各類芯片制造研發(fā)人員,人均20萬美元,每年芯片制造的人員薪資費(fèi)用總共60億美元。

芯片設(shè)計(jì)以及大語言模型的人力成本方面,按照英偉達(dá)+OpenAI+微軟服務(wù)器部門的1.5倍計(jì)算,約為5萬人,人均年薪30萬美元,共150億美元涉及服務(wù)器所有硬件制造的工廠人數(shù)為15萬人,電力以及用水保障設(shè)施人員15萬人,共30萬人,人均年薪8萬美元,總共為240億美元。

以上所有環(huán)節(jié),人力薪資成本為每年60億+150億+240億共450億美元。

物料成本方面,GPU及相關(guān)芯片,再加上所有服務(wù)器硬件的成本為2000美元/顆,年2000萬顆,即400億美元。

服務(wù)器的運(yùn)營(yíng)費(fèi)用方面,人工420億美元+物料成本400億美元+其他雜費(fèi)180億美元,取整數(shù)1000億美元。

OpenAI年產(chǎn)2000萬顆GPU的投資額及各項(xiàng)費(fèi)用推算,單位:美元

以上即奧特曼親自下場(chǎng)造芯涉及到的主要環(huán)節(jié)的費(fèi)用的拆解,如果替奧特曼花這筆錢,理想的方案是:2000億美元建設(shè)年產(chǎn)2000萬顆GPU(2024年全球約1000萬顆)以及涉及所有服務(wù)器硬件的制造工廠,然后為了推進(jìn)AGI的終極目標(biāo)每年投入1000億美元的研發(fā)投入,相關(guān)設(shè)計(jì)、研發(fā)、制造總?cè)肆Τ杀?000億美元,投資7000億建設(shè)能源以及用水的基礎(chǔ)設(shè)施,同時(shí)編列2000億美元現(xiàn)金應(yīng)付稅費(fèi)以及各種雜費(fèi)或者沒有計(jì)算到的費(fèi)用,最后保留4000億美元作為可能漏算的預(yù)備金,如此一來,大約需要1.7萬億美元,就可以覆蓋2000萬顆AI GPU所有制造工廠的啟動(dòng)資金。

運(yùn)營(yíng)資金方面,要保持每年1000億美元的芯片以及硬件新產(chǎn)能投入,并持續(xù)推進(jìn)摩爾定律,提升晶體管密度。每年新增2000億美元的新電力及新用水投入,再加上人工以及物料等每年約1000億美元,這樣的話,每年的極限是新增7000億美元的運(yùn)營(yíng)費(fèi)用。

如此一來,不到2萬億美元即可覆蓋2024年全球AI芯片需求量?jī)杀兜乃邢嚓P(guān)制造,能源基礎(chǔ)設(shè)施和運(yùn)營(yíng)費(fèi)用,每年新增控制在7000億美元的水平,這筆預(yù)算大致可以再燒7.5年。

怒砸2萬億美元,擁有全世界AI GPU兩倍產(chǎn)能 ,奧特曼也無法壟斷全球人工智能——OpenAI的模型領(lǐng)先全球,建立在以臺(tái)積電為代表的全球最先進(jìn)的芯片制造,以及以英偉達(dá)為代表的GPU芯片設(shè)計(jì)的基礎(chǔ)之上,如果奧特曼另起爐灶,全方位生產(chǎn)AI芯片,幾乎是得罪了目前全球的芯片企業(yè)。

作為“舊勢(shì)力”,臺(tái)積電、英偉達(dá)以及眾多芯片設(shè)計(jì)公司,有可能會(huì)扶持OpenAI的所有競(jìng)爭(zhēng)對(duì)手,包括硅谷乃至于全球的大大小小做大模型以及AI應(yīng)用的企業(yè),諸如老對(duì)手DeepMind加上谷歌,AWS,Mircosoft等巨頭,以及Stability、OpenAI前創(chuàng)始人成立的Anthropic等創(chuàng)企。

即便OpenAI的芯片設(shè)計(jì)與制造能力與臺(tái)積電、英偉達(dá)相當(dāng),面對(duì)全球所有大小模型與算法的一眾企業(yè),本身就不一定有絕對(duì)優(yōu)勢(shì),更何況帶著7萬億下場(chǎng)造芯片,站在英偉達(dá)、臺(tái)積電的對(duì)立面。

客觀地說,如果不考慮生態(tài),GPU設(shè)計(jì)公司倒不是那么無可替代。在GPU設(shè)計(jì)上,沒有英偉達(dá)還有AMD,甚至還有Cerebras這類設(shè)計(jì)整片晶圓面積遠(yuǎn)遠(yuǎn)超過傳統(tǒng)GPU的AI芯片設(shè)計(jì)公司,但在芯片制造上,目前臺(tái)積電呈現(xiàn)一騎絕塵的態(tài)勢(shì)。

以2024年為例,臺(tái)積電可生產(chǎn)每平方毫米高達(dá)2.84億晶體管密度的N3P工藝,排名第二的英特爾還只能生產(chǎn)每平方毫米1.8億晶體管的Intel 4,第一跟第二之間已經(jīng)出現(xiàn)了代差,如果在最高性能的芯片上不使用臺(tái)積電工藝,在基礎(chǔ)上就落后競(jìng)爭(zhēng)對(duì)手一個(gè)世代。

芯片制造無法用錢堆砌,更需要技術(shù)積累的行業(yè),往死里砸錢砸人,最快也要三年才能建設(shè)好芯片工廠并生產(chǎn)出芯片,對(duì)OpenAI來說,假設(shè)“7萬億”真實(shí)存在,面對(duì)“舊勢(shì)力”的反撲,也至少要撐過這三年。

文章來源:騰訊科技

騰訊科技

網(wǎng)友評(píng)論

聚超值•精選

推薦 手機(jī) 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
  • 二維碼 回到頂部