2022年末,ChatGPT的火熱出圈,帶動(dòng)了大模型和生成式AI的研發(fā)熱潮,高性能、高算力、低能耗的AI芯片銷量飆升,以英偉達(dá)A100、H100為代表的GPU芯片供不應(yīng)求,推動(dòng)其業(yè)績和市值雙雙創(chuàng)歷史新高,成為2023年躋身萬億美元市值俱樂部的新一代科技寡頭。
追溯英偉達(dá)的發(fā)展史,軟硬一體化是其商業(yè)模式的關(guān)鍵詞。其以GPU硬件縱向迭代為發(fā)展主軸,從定義顯卡的GeForce 256,到紙面算力達(dá)到1Exaflops(每秒進(jìn)行百億億次浮點(diǎn)運(yùn)算)的GH200芯片,其GPU產(chǎn)品性能緊貼客戶需求不斷升級(jí),并擴(kuò)展出GPU、CPU、DPU協(xié)同的硬件布局。軟件層面,其則通過開源的運(yùn)算平臺(tái)CUDA,橫向開拓廣闊的應(yīng)用市場,打造了與下游客戶不斷更新的需求相匹配的算力平臺(tái),進(jìn)而鏈接千行萬業(yè),成為AI時(shí)代智能駕駛、智能云、大模型、生成式AI等科技巨頭背后的“賣鏟人”。
內(nèi)部研發(fā)與外部收購并重,則是其保持技術(shù)領(lǐng)先的要訣。與所有科技巨頭一樣,其一手專注研發(fā),成立以來累計(jì)研發(fā)投入超過370億美元,打造了內(nèi)部技術(shù)迭代與進(jìn)化的澎湃動(dòng)能;一手頻頻外部收購,完善技術(shù)鏈條、延伸產(chǎn)業(yè)鏈,構(gòu)建了強(qiáng)客戶黏性的算力生態(tài)系統(tǒng)。
有效的策略,推動(dòng)英偉達(dá)在五次科技大風(fēng)口中迎風(fēng)起舞,20年間營收增長近14倍,凈利潤增長58倍。
隨著芯片產(chǎn)業(yè)整體競爭加劇,提出“做AI界的臺(tái)積電”新目標(biāo)的英偉達(dá),仍在加速奔跑。其一邊圍繞AI提升GPU硬件性能,擴(kuò)大軟件生態(tài),以快速迭代的新架構(gòu)、新產(chǎn)品,加固其技術(shù)護(hù)城河,實(shí)現(xiàn)“贏家通吃”;一手加碼投資AI賽道獨(dú)角獸企業(yè),擴(kuò)張其AI生態(tài)圈,以合作雙贏深度綁定B端客戶,放大平臺(tái)優(yōu)勢。
算力為王的時(shí)代,芯片是科技巨頭打造算力底座最核心的部件,微軟、谷歌、Meta、華為、百度等已自研AI芯片,并爭相構(gòu)建AI生態(tài)。算力軍備賽中,英偉達(dá)的領(lǐng)先優(yōu)勢將會(huì)持續(xù)多久呢?
來源:新財(cái)富雜志(ID:xcfplus)
作者:姬婧瑛
作為2023年市值增長最快的科技公司,英偉達(dá)(NVDA.O)備受各方關(guān)注。 2023年10月17日,拜登政府更新了針對(duì)AI芯片的出口管制規(guī)定,計(jì)劃阻止英偉達(dá)等公司向中國出口先進(jìn)的AI芯片。其A800和H800等芯片均受影響,用于游戲市場的RTX4090系列顯卡在國內(nèi)電商渠道已逐漸下架,存貨單價(jià)被炒高至5萬元。 AI時(shí)代,占據(jù)算力要沖的英偉達(dá),2023年1至9月股價(jià)已翻了兩倍,市值達(dá)到10843億美元,替代特斯拉成為美股“萬億美元市值俱樂部”的“老五”,同時(shí)也是全球市值最高的芯片股。 為其提供芯片制造和封裝服務(wù)的臺(tái)積電(TSM.N,2330.TW),以4631億美元市值緊隨其后,市值位居芯片行業(yè)第二。 8月28日,英偉達(dá)發(fā)布2024財(cái)年第二季(2023年4月30日至7月30日)財(cái)報(bào),當(dāng)季實(shí)現(xiàn)營收135.07億美元,同比增長101%,環(huán)比增長88%;凈利潤錄得61.88億美元,同比增長843%,環(huán)比增長203%,創(chuàng)歷史紀(jì)錄。 風(fēng)口起舞的英偉達(dá),何以成為新時(shí)代的科技寡頭?有志于國產(chǎn)替代的企業(yè),如何借鑒其成長經(jīng)驗(yàn)? 01、業(yè)績、市值均創(chuàng)歷史新高, 還有8年10倍成長空間 英偉達(dá)的營收主要來自游戲、數(shù)據(jù)中心、專業(yè)可視化、代工及其他、自動(dòng)駕駛五大市場。其中,游戲和數(shù)據(jù)中心是其營收支柱,二者占總營收的比重已由2014年的50.73%上升至2022年的89.24%,2023年二季度再度升至93.4%。 得益于這兩項(xiàng)業(yè)務(wù)的強(qiáng)勁增長,2013-2022年,英偉達(dá)營收和凈利潤分別增長5.5倍、8.9倍(圖1)。其凈資產(chǎn)收益率(ROE)由9.87%上升至19.8%,2023年二季度更升至29.93%,與A股ROE排第15名的山西汾酒(600809)接近。相比高通、AMD等芯片同行上下起伏的ROE,英偉達(dá)ROE長期穩(wěn)定在20%左右,使之堪稱性能穩(wěn)定的印鈔機(jī)(圖2)。 不得不說的是,2023年二季度,英偉達(dá)業(yè)績?nèi)绱吮l(fā)式增長,全靠上年同期業(yè)績的“襯托”和大模型業(yè)務(wù)的爆發(fā)。 一方面,其2022年同期的業(yè)績比較基數(shù)低。2021年12月至2022年9月,代表美股半導(dǎo)體行情的費(fèi)城半導(dǎo)體指數(shù)(SOX.GI)下跌40%,游戲市場萎縮和幣圈挖礦業(yè)務(wù)降溫,導(dǎo)致英偉達(dá)游戲業(yè)務(wù)營收驟降44%,專業(yè)可視化業(yè)務(wù)營收下降20%,代工和其他業(yè)務(wù)營收下降11%,其錄得近10年來第二差的季度業(yè)績,僅次于2019年二季度。 另一方面,芯片行業(yè)整體陷入蕭條的背景下,2022年11月末,美國科技公司OpenAI推出的ChatGPT爆火出圈,科技公司紛紛跟風(fēng)推出大模型,帶動(dòng)作為算力“剛需”的英偉達(dá)高性能GPU芯片A100和H100等供不應(yīng)求、價(jià)格飆漲,英偉達(dá)業(yè)績由此實(shí)現(xiàn)連續(xù)3個(gè)季度增長。 AI暖風(fēng)勁吹,英偉達(dá)股價(jià)昂揚(yáng)向上,2022年10月末至2023年6月13日,由112美元/股飆漲至400美元/股。其也因此首次躋身“萬億美元市值俱樂部”。2023年8月31日,其股價(jià)漲至494美元/股高點(diǎn),市值創(chuàng)歷史新高,達(dá)1.2萬億美元,是美股“萬億俱樂部”中2023年股價(jià)漲幅最大的“當(dāng)紅炸子雞”。 近5個(gè)財(cái)年(2018.1.28-2023.1.29),英偉達(dá)累計(jì)總股東回報(bào)達(dá)2.38倍,遠(yuǎn)高于標(biāo)準(zhǔn)普爾500指數(shù)、納斯達(dá)克100指數(shù)的回報(bào)(圖3)。 英偉達(dá)市值飆漲背后,是投資機(jī)構(gòu)真金白銀的下注。 Wind數(shù)據(jù)顯示,截至2023年6月30日,英偉達(dá)機(jī)構(gòu)股東數(shù)達(dá)3178家,持股市值5956億美元,較2022年12月31日的2338家增長36%,持股市值翻了1.7倍——而這僅是投資機(jī)構(gòu)半年的回報(bào)率。其大股東貝萊德(BlackRock)和先鋒集團(tuán)(Vanguard)均持股超過10年,合計(jì)持股從2017年末的11.31%增至2022年末的15.55%。大資金持股的時(shí)長,與其投資回報(bào)正相關(guān)。 值得一提的是,英偉達(dá)業(yè)績和股價(jià)雙升,是全球計(jì)算轉(zhuǎn)型的時(shí)代注腳。 算力世界正在從程序慢、成本高的通用計(jì)算,向加速計(jì)算過渡。正如英偉達(dá)創(chuàng)始人兼CEO黃仁勛所說,正在發(fā)生的計(jì)算轉(zhuǎn)型是一個(gè)轉(zhuǎn)折點(diǎn),世界各地的數(shù)據(jù)中心正在對(duì)此做出反應(yīng)和轉(zhuǎn)變。這一變革中,企業(yè)提高數(shù)據(jù)吞吐量、能源效率和成本效率的最佳方式是投資加速計(jì)算和生成式AI(Artificial Intelligence Generated Content,簡稱“AIGC”)。據(jù)麥肯錫的研究,AIGC每年對(duì)全球經(jīng)濟(jì)的貢獻(xiàn)將達(dá)7.9萬億美元。由此可以預(yù)見,遍及全球的算力轉(zhuǎn)型需求,將為高性能AI芯片帶來廣闊成長空間。 公開數(shù)據(jù)顯示,2020-2022年,全球GPU的市場規(guī)模分別為254.1億美元、334.7億美元、448.3億美元,年復(fù)合增長率為32.8%。按照這一增速保守估算,2030年全球GPU市場規(guī)模將達(dá)到4337億美元,8年有近10倍的成長空間。如果疊加2023年爆發(fā)的大模型和AIGC的強(qiáng)勁推動(dòng),市場空間將更大。 在二季度財(cái)報(bào)發(fā)布后的電話會(huì)議上,黃仁勛也提到:“目前全世界數(shù)據(jù)中心的價(jià)值高達(dá)1萬億美元,其中絕大部分使用的是CPU處理器。如果未來4到5年順應(yīng)AIGC大趨勢,大部分?jǐn)?shù)據(jù)中心改用GPU,這會(huì)是多么大的市場?” 英偉達(dá)顯然對(duì)獵獲這個(gè)增長紅利野心勃勃。 為了成為算力王者,向智能駕駛、智能云服務(wù)、大模型、加速計(jì)算等領(lǐng)域的掘金者“賣鏟”,英偉達(dá)正致力于成為軟硬一體化的AI算力解決方案供應(yīng)商:在硬件端,其建構(gòu)了“GPU+CPU+DPU”的全棧布局;而其開發(fā)的運(yùn)算平臺(tái)CUDA(Compute Unified Device Architecture,一種并行計(jì)算架構(gòu)),則被認(rèn)為是最適合深度學(xué)習(xí)和AI訓(xùn)練的架構(gòu),開源、可編程性能夠鏈接廣闊的軟件市場,并與通信服務(wù)提供商和數(shù)據(jù)中心建設(shè)者合力規(guī)劃下一代AI世界的基礎(chǔ)設(shè)施。 02、軟硬件一體化, 獨(dú)占GPU市場超80%份額 當(dāng)企業(yè)巨頭用科技魔力重塑我們的生活時(shí),那些性格色彩鮮明的商業(yè)大佬們,也在虛擬世界緊握著流量密碼。 英偉達(dá)的創(chuàng)始人兼CEO是被粉絲們稱為“華人之光”的黃仁勛。這位美籍華人在社交平臺(tái)擁有不輸明星的熱度和擁躉,其焊在身上的皮衣與英偉達(dá)的GPU產(chǎn)品一樣出圈。 1993年,30歲的皮衣刀客與另兩位合伙人克里斯(Chris Malachowsky)和普雷艾姆(Curtis Priem)創(chuàng)立英偉達(dá)。公司名稱“NVIDIA”取自拉丁文,意為嫉妒,公司標(biāo)識(shí)也用了嫉妒的綠眼睛。2023年,步入而立之年的英偉達(dá)確實(shí)成為了令人嫉妒的公司,連采購其GPU的大客戶特斯拉(TSLA.O)的CEO馬斯克也不無嫉妒地說了一句,“似乎每個(gè)人、每條狗都在購買GPU……獲得GPU比獲得毒品還難”。 英偉達(dá)早期以生產(chǎn)為游戲PC(個(gè)人電腦)提供渲染特效的圖形處理器(GPU或顯卡)為主。其以超越同行的性價(jià)比獲得了全球游戲廠商的大批訂單,1998年?duì)I收首次突破1億美元,達(dá)1.58億美元。1999年,其推出全球第一款可編程顯卡GeForce 256,當(dāng)年?duì)I收同比增長137%,達(dá)到3.75億美元。 1999年1月22日,成立約6年的英偉達(dá)在納斯達(dá)克掛牌上市,開啟了20多年的高速增長。 2003-2022年,英偉達(dá)營業(yè)收入由18.23億美元增至269.74億美元,凈利潤由0.74億美元增至43.68億美元,分別增長了14倍、58倍。 這20年中,英偉達(dá)精準(zhǔn)踩中了科技發(fā)展的五個(gè)大風(fēng)口:2005年的PC普及、2010年移動(dòng)互聯(lián)網(wǎng)、2016年的深度學(xué)習(xí)、2021年的幣圈“挖礦”以及2022年的AI大模型,其凈利潤均出現(xiàn)了非線性暴增(圖4)。 我們簡單將其20年的發(fā)展劃分為兩個(gè)階段,2013年之前為搭建業(yè)務(wù)架構(gòu)的蓄力階段,2013年至今為伴隨AI迎風(fēng)發(fā)展階段。 搭建一體化業(yè)務(wù)架構(gòu),英偉達(dá)和AMD雙寡頭格局成型 第一階段中,2005年P(guān)C銷量爆發(fā)和2006年CUDA研發(fā)面世,是英偉達(dá)搭建業(yè)務(wù)底座的兩個(gè)關(guān)鍵節(jié)點(diǎn),前者奠定其產(chǎn)品搭載規(guī)模,后者為其打開通向軟件市場之門。 2005年,從工業(yè)設(shè)計(jì)、工業(yè)造型,到電影、高清廣播、醫(yī)學(xué)成像,數(shù)字革命幾乎席卷所有行業(yè),全球PC銷量達(dá)到2.185億臺(tái),操作系統(tǒng)供應(yīng)商微軟2005財(cái)年凈利潤同比大增50%,2006財(cái)年?duì)I收突破400億美元,并以超過2600億美元的市值成為全球市值TOP10企業(yè)中唯一的科技企業(yè)。而搭乘微軟東風(fēng)的DirectX 9.0 GPU,在圖形處理器市場獨(dú)領(lǐng)風(fēng)騷。 DirectX 9.0 GPU是英偉達(dá)可編程GPU與微軟DirectX 9.0高級(jí)著色語言的組合產(chǎn)品,能夠高效處理和編輯高清數(shù)字視頻、數(shù)字照片的圖像,使計(jì)算機(jī)圖形達(dá)到電影級(jí)視效。 英偉達(dá)與微軟的合作最早在2000年3月,英偉達(dá)成為微軟第一款家用電視游戲機(jī)Xbox的獨(dú)家圖形引擎供應(yīng)商。當(dāng)年6月,英偉達(dá)即被《商業(yè)周刊》評(píng)為全球第一的半導(dǎo)體公司;11月,其以7000萬美元現(xiàn)金加100萬股股票收購競爭對(duì)手“3Dfx”的圖形處理器核心資產(chǎn),成為圖形處理器行業(yè)規(guī)模第一的公司。 2001-2003財(cái)年,英偉達(dá)營收由7.35億美元增至19.1億美元,年復(fù)合增長率達(dá)61%。突飛猛進(jìn)的業(yè)績讓英偉達(dá)初嘗游戲產(chǎn)品的甜頭,自此,其錨定了以GPU硬件為核心主線的業(yè)務(wù)發(fā)展路徑。 2004年,英偉達(dá)GeForce 6800和6600 GPU量產(chǎn),推動(dòng)其DirectX 9.0 GPU在兼容圖形處理器領(lǐng)域的市場份額從21%上升至67%。2005年,趁熱打鐵的英偉達(dá)進(jìn)一步擴(kuò)展其架構(gòu)和技術(shù)優(yōu)勢,當(dāng)年6月發(fā)布的GeForce 7800將其市場份額從67%進(jìn)一步拉升到79%,成為GPU市場的第一大供應(yīng)商。此時(shí),英偉達(dá)已將客戶需求融入產(chǎn)品DNA,其GPU隨著微軟操作系統(tǒng)迭代升級(jí)而快速升級(jí)。 配合客戶需求而發(fā)展的GeForce系列,成為英偉達(dá)最長青的產(chǎn)品系列之一。其2023年推出的最新產(chǎn)品GeForce RTX 4090,單價(jià)12999元起。 值得一提的,上世紀(jì)90年代,硅谷誕生了一批專研圖形處理器的公司,它們大多淹沒在技術(shù)迭代的洪流中,而英偉達(dá)能夠穿越周期,成長為全球GPU龍頭,另一個(gè)重要的基石是從硬件向更廣闊的軟件市場延伸,最重要的工具是CUDA。CUDA之于英偉達(dá),類似安卓系統(tǒng)之于谷歌。 2003年,斯坦福大學(xué)博士生伊恩·巴克(Ian Buck,現(xiàn)任英偉達(dá)加速計(jì)算總經(jīng)理)進(jìn)入英偉達(dá)實(shí)習(xí),其所在團(tuán)隊(duì)為解決微軟創(chuàng)建的應(yīng)用程序接口DirectX的編程門檻過高問題,推出了編程模型Brook。2006年,伊恩·巴克正式加入英偉達(dá),并基于Brook模型研發(fā)出CUDA,利用GPU中的并行計(jì)算引擎來解決復(fù)雜的計(jì)算問題,可以加快密集型應(yīng)用程序的計(jì)算速度,比單獨(dú)使用一個(gè)CPU的速度更快。 2007年開始,英偉達(dá)將CUDA內(nèi)置入其所有GPU產(chǎn)品中。CUDA以彼時(shí)最廣泛使用的C語言為基礎(chǔ),不同客戶的程序員可以根據(jù)具體需求和處理任務(wù),對(duì)GPU進(jìn)行相應(yīng)編程,這一應(yīng)用很快在程序員群體中流行,具備了成為通用計(jì)算工具的能力。這一能力,磨刀霍霍切分CPU廠商的蛋糕,引來了CPU巨頭的聯(lián)合圍剿。 2006年,從英偉達(dá)采購90% GPU的AMD,以54億美元對(duì)價(jià)收購GPU供應(yīng)商ATI,形成CPU整合GPU的新型解決方案。2007年,英特爾收購物理加速引擎公司Havok,并發(fā)布CPU融合GPU的Larrabee架構(gòu),欲在其CPU中集成GPU。 CPU大廠絞殺疊加經(jīng)濟(jì)危機(jī)影響,2008年9月,業(yè)績承壓的英偉達(dá)宣布裁員6.5%。同年11月,英偉達(dá)發(fā)布的2009財(cái)年三季度財(cái)報(bào)顯示,其營收下降20%,凈利潤下降74%至0.6億美元,回到了2000年的水平。2008年和2009年,成為英偉達(dá)上市以來唯二的虧損年度。利空催化下,其股價(jià)一年內(nèi)蒸發(fā)了85%。 業(yè)績和市值雙殺,成為黃仁勛創(chuàng)業(yè)生涯中一次刻骨銘心的失敗記憶。 試圖提振業(yè)績的英偉達(dá),抓住了移動(dòng)互聯(lián)網(wǎng)發(fā)端的“救命稻草”。2010年,英偉達(dá)開辟移動(dòng)市場業(yè)務(wù),推出費(fèi)米架構(gòu)(Fermi)和基于該架構(gòu)的新一代Quadro GPU,其3D應(yīng)用性能比上一代Quadro產(chǎn)品快5倍,計(jì)算模擬性能比上一代產(chǎn)品快8倍。這助推其專業(yè)解決方案(PSB)業(yè)務(wù)和消費(fèi)者產(chǎn)品(CPB)業(yè)務(wù)營收分別實(shí)現(xiàn)60%、27%的增長。但是,隨著競爭對(duì)手大量涌入,英偉達(dá)決定放棄移動(dòng)市場,回歸并聚焦PC端產(chǎn)品。 這次取舍對(duì)于英偉達(dá)發(fā)展的重要性不言而喻,正如黃仁勛在2023年臺(tái)灣大學(xué)畢業(yè)典禮演講中所言,“戰(zhàn)略性撤退、犧牲、決定放棄什么才是成功的核心,并且非常關(guān)鍵”。 值得一提的是,業(yè)績低迷期間,英偉達(dá)并未停下技術(shù)升級(jí)的腳步,3年投入26億美元進(jìn)行研發(fā),以優(yōu)化晶體管層的設(shè)計(jì)來解決散熱壓力帶來的產(chǎn)品良率困擾,從而大幅提升產(chǎn)品性能和功耗比。 或許正是英偉達(dá)GPU和架構(gòu)的快速迭代形成的壓力,2009年末,英特爾宣布無限期推遲Larrabee架構(gòu)發(fā)行,并于2011年1月再度與英偉達(dá)簽訂6年的專利交叉許可協(xié)議。伴隨英特爾的退出,GPU領(lǐng)域英偉達(dá)和AMD的雙寡頭競爭格局成型,且持續(xù)至今。 超前設(shè)計(jì)的CUDA架構(gòu),與市場的生化反應(yīng)延遲到了2010年才發(fā)生。這一年,AI先驅(qū)吳恩達(dá)使用AI程序識(shí)別出一只貓,使用了16000個(gè)CPU處理器,但是將CPU換成GPU,只需要12個(gè)GPU。2012年的ImageNet大賽(大規(guī)模視覺識(shí)別挑戰(zhàn)賽)上,卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet以超出第二名10%以上的正確率獲得冠軍,其利用英偉達(dá)GPU的計(jì)算能力解決了復(fù)雜的模型問題。自此,英偉達(dá)GPU被認(rèn)為適用深度學(xué)習(xí),被AI企業(yè)大量采購。 至此,GPU和CUDA已成為英偉達(dá)故事中關(guān)鍵的“1”,此后,其發(fā)展主線聚焦于縱向技術(shù)迭代和橫向應(yīng)用拓展,不斷在后面疊加“0”。 縱向技術(shù)升級(jí),得益于關(guān)鍵技術(shù)的引進(jìn)。例如,2016年,英偉達(dá)引入Tensor Core & NVLink高速互聯(lián)技術(shù),以多個(gè)GPU組建為GPU陣列,進(jìn)而形成超級(jí)GPU,為超強(qiáng)算力奠定了硬件基礎(chǔ);2022年,其引入NVSwitch交換互聯(lián)技術(shù),大幅降低了GPU通訊的延遲,提升了AI大模型高速并行計(jì)算中數(shù)據(jù)同步的效率,為其GPU在深度學(xué)習(xí)領(lǐng)域建立了強(qiáng)大的競爭壁壘。 這些關(guān)鍵性的技術(shù)突破,讓英偉達(dá)的芯片可以不斷拓展出大規(guī)模的芯片集群,進(jìn)而搭建出任意形式的芯片拓?fù)浣Y(jié)構(gòu)。2022年末,英偉達(dá)GPU顯卡中的CUDA Core(核心)數(shù)量已較2007年提升超30倍,其GPU搭載于世界上最快的超級(jí)計(jì)算機(jī)。 橫向應(yīng)用擴(kuò)展方面,英偉達(dá)逐漸衍生出“GPU+CPU+DPU”的全棧布局,先后開發(fā)出Kelvin、Rankine、Curie、Tesla、Fermi、Kepler、Maxwell、Volta、Turing、Ampere、Hopper等不斷升級(jí)的架構(gòu),并在這些架構(gòu)基礎(chǔ)上推出十多個(gè)產(chǎn)品系列(表1),支持從圖像處理到并行計(jì)算再到AI數(shù)據(jù)處理等不同應(yīng)用場景,英偉達(dá)的產(chǎn)品已成為GPU芯片專業(yè)性能和兼容性的基準(zhǔn)。 數(shù)據(jù)中心替代游戲成最大營收支柱,凈資產(chǎn)收益率穩(wěn)定在20%左右 英偉達(dá)的營收中,游戲和數(shù)據(jù)中心是核心支柱,二者占營收的比重由2014年的50.73%升至2023年二季度的93.4%(表2)。 這一變化來自游戲市場和AI產(chǎn)業(yè)對(duì)GPU日益膨脹的需求,而市場風(fēng)口的切換,直觀體現(xiàn)在英偉達(dá)營收支柱的切換(圖5)。 2021年前,游戲業(yè)務(wù)是英偉達(dá)絕對(duì)的營收支柱。2014-2021年,其游戲產(chǎn)品營收由20.58億美元增至124.62億美元,年復(fù)合增長率達(dá)30%。 近20年來,全球3A/3D游戲不斷推新,催生了對(duì)GPU處理器的巨大需求。全球億萬玩家倒逼高性能3D圖形渲染成為PC制造商重要的差異化賣點(diǎn),而GPU是PC實(shí)現(xiàn)這一差異化的關(guān)鍵部件,因此,PC代工廠商進(jìn)一步倒逼英偉達(dá)的GPU在滿足終端用戶、程序開發(fā)商和設(shè)備制造廠商三方需求中不斷尋求平衡。 從早期的《生化危機(jī)》《全面戰(zhàn)爭》《榮譽(yù)勛章》到后來的《魔獸世界》《英雄聯(lián)盟》《王者榮耀》等網(wǎng)絡(luò)游戲,均擁有超長的生命周期,它們背后億萬付費(fèi)玩家在全球培育出動(dòng)視暴雪(ATVI.O,2022年1月被微軟以687億美元對(duì)價(jià)收購,2023年10月下旬完成交易)、騰訊、網(wǎng)易等多家市值超5000億元的公司。 2022年,全球游戲市場營收約為1844億美元,網(wǎng)絡(luò)游戲市場營收為1326億美元,占比達(dá)72%。其中,中國是網(wǎng)絡(luò)游戲最大市場,貢獻(xiàn)了全球收入的20.1%。2003-2021年,游戲市場規(guī)模急劇擴(kuò)張,中國游戲市場規(guī)模由13.2億元增長至2965.13億元,18年擴(kuò)大224倍。 面對(duì)如此擴(kuò)容的市場,主要面對(duì)PC端用戶的英偉達(dá)開發(fā)出四類產(chǎn)品,包括用于臺(tái)式機(jī)和筆記本電腦游戲的GeForce RTX和GeForce GTX GPU、用于低功耗設(shè)備上玩PC游戲的GeForce NOW、用于電視上播放高質(zhì)量流媒體的SHIELD,以及適用于游戲主機(jī)的片上系統(tǒng)(SOC)和開發(fā)服務(wù)。 不玩網(wǎng)絡(luò)游戲的人很難體會(huì)顯卡配置的重要性,但通過間隔一年的兩代產(chǎn)品,可以看出英偉達(dá)顯卡的迭代效率。 2022年9月,英偉達(dá)發(fā)布了Ada Lovelace GPU架構(gòu),并推出了基于該架構(gòu)的首批產(chǎn)品,包括GeForce RTX 4090、RTX 4080和RTX 4070。其中,RTX 4090內(nèi)置760億個(gè)晶體管、16384個(gè)CUDA核心和24GB高速鎂光GDDR6X顯存,在4K分辨率的游戲中持續(xù)運(yùn)行速度超過100FPS,光線追蹤技術(shù)帶來的纖毫畢現(xiàn)得以完美實(shí)現(xiàn)。而其于2020年9月發(fā)布的GeForce RTX 3090產(chǎn)品,內(nèi)置283億個(gè)晶體管、10496個(gè)CUDA核心和24GB GDDR6X顯存。 4090較3090性能提升2-4倍,但功耗同樣保持在450W。保持同等能耗的基礎(chǔ)上大幅提升產(chǎn)品性能,對(duì)于芯片公司是翻山越嶺的難度。 即便產(chǎn)品性能提升不止,2021年后,英偉達(dá)游戲業(yè)務(wù)營收仍掉頭直下。英偉達(dá)在其年報(bào)中的解釋是,“全球宏觀經(jīng)濟(jì)狀況及中國游戲需求下降的影響”。 被英偉達(dá)特別強(qiáng)調(diào)的中國市場(不包含臺(tái)灣地區(qū)),多年來一直是其銷售額最高的市場之一,但近年銷售額明顯下降,由2021年的71.11億美元下降至2022年的57.85億美元,占英偉達(dá)總營收的比重由2021年的26.42%下降至2023年上半年的20.92%(圖6、7),中國市場的重要性可見一斑。 接替游戲成為英偉達(dá)創(chuàng)收支柱的,是數(shù)據(jù)中心。2023年上半年,這一業(yè)務(wù)的營收達(dá)到146.07億美元,接近2022年全年150.05億美元的水平,直線拉升了英偉達(dá)的業(yè)績。 數(shù)據(jù)中心的營收不是突然暴增。2014-2022年,英偉達(dá)數(shù)據(jù)中心的營收年復(fù)合增長率達(dá)62%。同期,英特爾的數(shù)據(jù)中心營收由143.87億美元增至191.96億美元,年復(fù)合增長率為3.7%。兩家公司數(shù)據(jù)中心的業(yè)務(wù)雖然不同,但英偉達(dá)增速之快,可見一斑。 數(shù)據(jù)中心業(yè)務(wù)是什么? 根據(jù)英偉達(dá)財(cái)報(bào)中的闡述,我們可以將其簡單理解為算力平臺(tái)或者算力服務(wù)。 英偉達(dá)算力平臺(tái),由英偉達(dá)的高能效GPU、數(shù)據(jù)處理單元(DPU)、互連和系統(tǒng)、CUDA編程模型,以及越來越多的軟件庫、軟件開發(fā)工具包(SDK)、應(yīng)用框架和服務(wù)組成,服務(wù)于大多數(shù)加速計(jì)算密集型的工作負(fù)載,如AI、數(shù)據(jù)分析、圖形和科學(xué)計(jì)算、超大規(guī)模云和企業(yè)、公共部門和邊緣數(shù)據(jù)中心等。該平臺(tái)既可以作為整體系統(tǒng)打包出售,也可以單獨(dú)出售,以應(yīng)對(duì)客戶的定制化需求。 英偉達(dá)的GPU和相關(guān)軟件的大規(guī)模并行計(jì)算架構(gòu)非常適合深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和高性能計(jì)算,為AI時(shí)代的規(guī)?;?jì)算提供動(dòng)力。加速計(jì)算的能力,令英偉達(dá)得以借力三個(gè)應(yīng)用風(fēng)口,成就AI時(shí)代的高速發(fā)展。 第一個(gè)風(fēng)口,2016年深度學(xué)習(xí)接管互聯(lián)網(wǎng)。2015年的英偉達(dá)GPU技術(shù)大會(huì)上(GTC大會(huì)),黃仁勛宣布英偉達(dá)全面轉(zhuǎn)型AI。2016年3月,谷歌的機(jī)器人阿爾法狗(AlphaGo)擊敗了圍棋世界冠軍、職業(yè)九段棋手李世石,引發(fā)全球關(guān)注深度學(xué)習(xí)。隨后,谷歌、微軟等互聯(lián)網(wǎng)巨頭快速將各自的深度學(xué)習(xí)平臺(tái)開源,供全球開發(fā)者無壁壘使用,向企業(yè)提供傳統(tǒng)編碼無法提供的云和AI服務(wù),大量數(shù)據(jù)反哺深度學(xué)習(xí),加速了AI的進(jìn)化。英偉達(dá)推出NVIDIA TensorRT深度學(xué)習(xí)推理框架和Inception計(jì)劃,以支持深度學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域的初創(chuàng)企業(yè)發(fā)展,這帶動(dòng)其2016年GPU業(yè)務(wù)營收同比增長39%。 第二個(gè)風(fēng)口,2021年加密貨幣“挖礦”產(chǎn)業(yè)回春。英偉達(dá)推出了Lite Hash Rate(LHR)和GeForce GPU,并增加了CMP(cryptocurrency mining processors,加密貨幣處理器)的供應(yīng),以滿足“挖礦”大規(guī)模計(jì)算的需求。2021年一季度,CMP為英偉達(dá)創(chuàng)收1.55億美元,上半年創(chuàng)收4.21億美元,部分對(duì)沖了游戲市場下滑對(duì)其業(yè)績的負(fù)面影響。 第三個(gè)風(fēng)口,2022年11月,語言大模型催化AI時(shí)代提前到來。這一年11月30日,OpenAI推出ChatGPT,5天內(nèi)注冊用戶數(shù)超過100萬,兩個(gè)月后月活用戶超過1億,成為史上增長最快應(yīng)用,全球掀起語言大模型和AIGC研發(fā)潮。中國市場以華為盤古、百度文心、騰訊混元、阿里通義為代表的大模型如雨后春筍般涌現(xiàn),對(duì)高性能芯片的需求井噴。 AI大模型是“大數(shù)據(jù)、大算力、強(qiáng)算法”結(jié)合的產(chǎn)物,其中,大算力堪稱基礎(chǔ)設(shè)施。英偉達(dá)基于Hopper和Ampere架構(gòu)推出的A100、H100以及特供中國市場的A800和H800(A100和H100部分性能減配的替代產(chǎn)品)等高性能芯片,是AI大模型的核心部件。 大模型潮起,英偉達(dá)“A+H”系列芯片銷量激增。2023年8月10日,多家媒體報(bào)道,百度、騰訊、阿里等中國企業(yè)向英偉達(dá)采購約10萬顆A800、H800處理器,訂單總額或超50億美元。 AMD的CEO蘇姿豐(Lisa Su)曾提出,2023年,全球數(shù)據(jù)中心AI加速器的潛在市場總額將達(dá)到300億美元左右,預(yù)計(jì)到2027年,這一數(shù)字將超過1500億美元(折合1.095萬億元),年復(fù)合增長率超過50%。這意味著,英偉達(dá)數(shù)據(jù)中心未來營收的增長空間巨大。 除了硬件支持,英偉達(dá)也提供大模型服務(wù),推出語言模型NVIDIA NeMo、圖像視頻模型NVIDIA Picasso、藥物研發(fā)模型NVIDIA BioNeMo等全棧式服務(wù),用戶可自定義用例并調(diào)整模型。 值得一提的是,除了中國科技圈興起“百模大戰(zhàn)”,業(yè)務(wù)與AI毫不沾邊的上市公司也在采購高算力芯片處理器,以圖跨界“算力”提振股價(jià)。 2023年9月29日,蓮花健康(600186)公告,其全資子公司杭州蓮花科技創(chuàng)新有限公司將以6.93億元的總價(jià),向新華三集團(tuán)控股子公司新華三信息技術(shù)有限公司采購330臺(tái)英偉達(dá)H800 GPU系列算力服務(wù)器(每臺(tái)服務(wù)器含8張GPU)。在此之前的一個(gè)月內(nèi),蓮花健康股價(jià)由3.22元/股上漲至5.98元/股,大漲86%,創(chuàng)5年來新高?!八懔Α备拍顚?duì)A股公司市值的提振效力,可見一斑。 馬太效應(yīng)下,越來越多不同行業(yè)的企業(yè)和初創(chuàng)企業(yè)使用英偉達(dá)的GPU和軟件,將其構(gòu)建的產(chǎn)品和服務(wù)實(shí)現(xiàn)自動(dòng)化。例如,專業(yè)設(shè)計(jì)師使用其GPU和軟件創(chuàng)建電影中的視覺效果,并設(shè)計(jì)從手機(jī)到商用飛機(jī)的建筑物和產(chǎn)品;交通運(yùn)輸行業(yè)用其構(gòu)建自動(dòng)駕駛平臺(tái);醫(yī)療保健行業(yè)用以增強(qiáng)醫(yī)學(xué)成像和加速藥物發(fā)現(xiàn);金融服務(wù)行業(yè)借此進(jìn)行欺詐檢測。 英偉達(dá)成為二季度全球業(yè)績增長最強(qiáng)勁的科技公司背后,是其在顯卡領(lǐng)域遙遙領(lǐng)先的市場份額。公開數(shù)據(jù)顯示,英偉達(dá)占據(jù)全球數(shù)據(jù)中心AI加速市場82%的份額,而且,以95%的市場占有率壟斷了全球Al訓(xùn)練市場。 近乎“壟斷”的市場地位,簡單總結(jié)源于英偉達(dá)三方面的優(yōu)勢。 一是產(chǎn)品和架構(gòu)。基于架構(gòu)的靈活性、多功能性和穩(wěn)定高速性能,英偉達(dá)能夠勝任從數(shù)據(jù)處理到訓(xùn)練、推理,推理前對(duì)數(shù)據(jù)所進(jìn)行的預(yù)處理,再到后期的數(shù)據(jù)處理,語言進(jìn)行標(biāo)識(shí)化以便用于訓(xùn)練等任務(wù)。尤其是大模型和AIGC的工作流程強(qiáng)度大,大量的應(yīng)用程序需要強(qiáng)大的并行處理能力,英偉達(dá)的架構(gòu)組合和產(chǎn)品能夠加速中心計(jì)算程序,以保證最低的運(yùn)算和保有成本。 二是規(guī)模和速度。在游戲、智能駕駛、大模型、加速計(jì)算、智能云等終端上,英偉達(dá)已擁有龐大的安裝量。龐大的規(guī)模和超快速度,決定了英偉達(dá)能夠在不同的使用模型和計(jì)算環(huán)境中,持續(xù)發(fā)展極其復(fù)雜的軟硬件、網(wǎng)絡(luò)和計(jì)算堆棧,在保質(zhì)保量的前提下加快客戶的工程進(jìn)度。而軟件開發(fā)者能夠通過英偉達(dá)的平臺(tái),接觸最大數(shù)量的終端用戶,提升業(yè)務(wù)或獲得投資回報(bào)。規(guī)模效應(yīng)下,在行業(yè)未出現(xiàn)大的技術(shù)創(chuàng)新和拐點(diǎn)前提下,強(qiáng)者愈強(qiáng)的馬太效應(yīng)將不斷鞏固英偉達(dá)的領(lǐng)先優(yōu)勢。 三是系統(tǒng)和生態(tài)。在AI大模型訓(xùn)練等并行工作負(fù)載中,性能強(qiáng)大的芯片處理器重要,軟件生態(tài)更重要。性能強(qiáng)大的GPU讓英偉達(dá)成為芯片巨頭,但使英偉達(dá)成為全棧計(jì)算平臺(tái)的,是其龐大的軟件體系。 英偉達(dá)除了提供CUDA并行編程模型、CUDA-X應(yīng)用加速庫、應(yīng)用程序編程接口(API)、SDK和工具以及特定領(lǐng)域的應(yīng)用程序框架,還提供NVIDIA GPU Cloud注冊表(NGC),這是一個(gè)涵蓋科學(xué)計(jì)算、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)等領(lǐng)域、易于使用且經(jīng)過優(yōu)化的軟件堆棧的全面目錄。借助NGC,AI開發(fā)人員、研究人員和數(shù)據(jù)科學(xué)家可以開發(fā)AI和HPC(高性能計(jì)算)應(yīng)用。 基于英偉達(dá)構(gòu)建的軟件系統(tǒng),其硬件可以在每個(gè)大型計(jì)算機(jī)制造商和大型云服務(wù)器(CSP)的行業(yè)標(biāo)準(zhǔn)服務(wù)器中使用,也可以在英偉達(dá)DGX AI超級(jí)計(jì)算機(jī)中使用(DGX是一個(gè)專門為深度學(xué)習(xí)和GPU加速應(yīng)用而構(gòu)建的系統(tǒng))。為了擴(kuò)大可用客戶群體、降低使用門檻,英偉達(dá)圍繞GPU構(gòu)建了多種現(xiàn)成系統(tǒng),包括面向超大規(guī)模和超級(jí)計(jì)算數(shù)據(jù)中心的HGX、面向企業(yè)和邊緣計(jì)算的EGX、面向高精度邊緣人工智能的IGX以及面向自主機(jī)器的Argan。 算力王者背后,是英偉達(dá)從產(chǎn)品到平臺(tái)再到生態(tài)系統(tǒng)不斷進(jìn)化,并擴(kuò)大其領(lǐng)先優(yōu)勢。那么,英偉達(dá)這樣的優(yōu)勢能否輕易復(fù)制呢? 03、370億美元投入研發(fā), 專業(yè)化收購?fù)晟萍夹g(shù)鏈 風(fēng)口即市場需求,連續(xù)踩中科技產(chǎn)業(yè)發(fā)展風(fēng)口,背后是英偉達(dá)滿足爆發(fā)性算力需求的能力。 這一能力,源自其對(duì)變化中的早期市場和初創(chuàng)公司的關(guān)注和長期布局。例如,在ChatGPT爆紅出圈之前的2016年,黃仁勛已拜訪創(chuàng)立于2015年12月的OpenAI,并捐贈(zèng)搭載8顆P100價(jià)值百萬的超級(jí)計(jì)算機(jī)DGX-1,成為“為ChatGPT算力助攻的英偉達(dá)”。 插播一句,OpenAI采用了與AI先行者谷歌不同的技術(shù)路線,谷歌2017年6月推出具有6500萬個(gè)可調(diào)用參數(shù)的Transformer模型,而OpenAI采用GPT(生成式預(yù)訓(xùn)練)模型,并于2018年推出具有1.17億個(gè)參數(shù)的GPT-1。二者之間的技術(shù)競賽自此開啟。 我們從其產(chǎn)品迭代的時(shí)間密集度上,感受一下OpenAI進(jìn)化的速度:2019年2月15億參數(shù)的GPT-2、2020年5月1750億參數(shù)的GPT-3、2021年1月120億參數(shù)的DALL-E、2021年6月120億參數(shù)的Codex、2022年3月13億參數(shù)的InstructGPT、2022年11月末20億參數(shù)的ChatGPT相繼推出。 OpenAI每一次進(jìn)化,都伴隨著谷歌的迭代回應(yīng)。2021年5月,谷歌發(fā)布1370億參數(shù)的AI系統(tǒng)LaMDA對(duì)話應(yīng)用語言模型。正是巨頭之間你追我趕的競爭,才推動(dòng)了全面AI時(shí)代的提前到來。 堪稱初創(chuàng)公司算力最強(qiáng)助攻的英偉達(dá),全球超過30000家合作伙伴中,15000家是初創(chuàng)公司,其中包括數(shù)千家AIGC公司。截至2023年1月末,英偉達(dá)GPU支持的應(yīng)用程序已超過2800個(gè)。英偉達(dá)為全球TOP500排行榜上超過70%的超級(jí)計(jì)算機(jī)提供支持,其中包括Green500排行榜上排名前30的系統(tǒng)中的23個(gè)。正如三六零(601360)創(chuàng)始人、董事長周鴻祎評(píng)價(jià)英偉達(dá),“對(duì)用戶真正產(chǎn)生價(jià)值,才能慢慢生出偉大”。 如前所述,從賣GPU顯卡,到賣平臺(tái)服務(wù),再到構(gòu)建軟硬一體的AI算力生態(tài)系統(tǒng),推動(dòng)英偉達(dá)演進(jìn)的核心動(dòng)能來自研發(fā)與收購。 “Innovation is at our core”(創(chuàng)新是我們的核心)是英偉達(dá)每一年的年報(bào)中均會(huì)出現(xiàn)的固定表達(dá)。研發(fā)是科技公司的第一生產(chǎn)力,截至2023年1月末,英偉達(dá)研發(fā)方面的投入累計(jì)超過370億美元,擁有19532名研發(fā)人員,占員工總數(shù)的75%。 其中,2013-2022年,其研發(fā)支出的絕對(duì)值保持著高速增長,研發(fā)占營收的比重穩(wěn)定維持在20%(圖8)。與同類可比上市公司相比,英偉達(dá)研發(fā)投入占營收的比重達(dá)23.47%,高于高通和AMD(表3)。 除了真金白銀做研發(fā),從內(nèi)部構(gòu)筑技術(shù)發(fā)展動(dòng)能,英偉達(dá)也以收購從外部完善技術(shù)鏈。 科技行業(yè)是并購重組的主陣地,英偉達(dá)30年的發(fā)展歷程中,并購時(shí)有發(fā)生。從2000年收購圖形芯片廠商3dfx,到2023年計(jì)劃收購移動(dòng)芯片供應(yīng)商ARM,英偉達(dá)借助收購來實(shí)現(xiàn)技術(shù)躍升、業(yè)務(wù)拓展,從而實(shí)現(xiàn)業(yè)務(wù)轉(zhuǎn)型和產(chǎn)業(yè)鏈完整。 我們從代表性的案例,來看資產(chǎn)收購對(duì)英偉達(dá)的意義。 第一,2019年3月至2020年4月,英偉達(dá)以70億美元的對(duì)價(jià)收購以色列芯片制造商邁絡(luò)思科技有限公司(Mellanox Technologies,簡稱“Mellanox”)。該公司是全球領(lǐng)先的服務(wù)器和存儲(chǔ)端到端連接解決方案的供應(yīng)商,產(chǎn)品包括以太網(wǎng)交換機(jī)、InfiniBand智能互連解決方案、服務(wù)器、存儲(chǔ)設(shè)備和超融合基礎(chǔ)設(shè)施,應(yīng)用于高性能計(jì)算、云計(jì)算、數(shù)據(jù)中心、企業(yè)計(jì)算及存儲(chǔ)市場,全球500強(qiáng)超級(jí)計(jì)算機(jī)中超過一半使用其設(shè)備。 借此收購,英偉達(dá)硬件產(chǎn)品布局得以從GPU擴(kuò)展至DPU。英偉達(dá)推出了BlueField DPU,由數(shù)據(jù)中心基礎(chǔ)架構(gòu)軟件DOCA提供支持,通過DOCA,開發(fā)人員可以為BlueField DPU構(gòu)建軟件定義、硬件加速的網(wǎng)絡(luò)、安全、存儲(chǔ)和管理等應(yīng)用程序。因此,英偉達(dá)可以在整個(gè)計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)堆棧中進(jìn)行優(yōu)化,以提供數(shù)據(jù)中心規(guī)模的計(jì)算解決方案。目前,BlueField DPU應(yīng)用于頂級(jí)的安全、存儲(chǔ)和網(wǎng)絡(luò)公司,但滲透率還比較低。 黃仁勛在2022財(cái)年第一季度財(cái)報(bào)發(fā)布時(shí)表示:“Mellanox收購?fù)瓿梢荒陙?,超出了我們的預(yù)期,英偉達(dá)也轉(zhuǎn)型為一家數(shù)據(jù)中心級(jí)計(jì)算公司?!?/p> 第二,2022年1月10日,英偉達(dá)收購其十多年的合作伙伴Bright Computing。該公司成立于2009年,是全球領(lǐng)先的高性能計(jì)算軟件開發(fā)商,其所生產(chǎn)的軟件管理著全球700多個(gè)組織使用的高性能計(jì)算系統(tǒng)。 借此收購,英偉達(dá)強(qiáng)化了其軟件在邊緣計(jì)算、數(shù)據(jù)中心和公有云、混合云等領(lǐng)域的運(yùn)作能力,從而進(jìn)一步擴(kuò)大其高性能計(jì)算市場。截至2023年1月末,全球25個(gè)高性能計(jì)算應(yīng)用程序中的23個(gè)使用英偉達(dá)的產(chǎn)品。 第三,2022年3月,英偉達(dá)收購其合作伙伴Excelero。該公司成立于2014年,是一家高性能軟件定義存儲(chǔ)供應(yīng)商,其開發(fā)的NVMesh軟件,可管理和保護(hù)NVMe閃存驅(qū)動(dòng)器的虛擬陣列,作為跨公有云和私有云的塊存儲(chǔ),其塊存儲(chǔ)在運(yùn)行DPU的DOCA軟件框架中發(fā)揮重要作用。被收購后,Excelero的技術(shù)被集成到英偉達(dá)的軟件堆棧中,并應(yīng)用到AI和高性能計(jì)算平臺(tái)。 第四,2023年7月,英偉達(dá)收購了AI初創(chuàng)公司OmniML。該公司成立于2021年的美國加州,主要產(chǎn)品是一個(gè)旨在快速、輕松地大規(guī)模進(jìn)行AI優(yōu)化的平臺(tái)Omnimizer,其軟件可以壓縮機(jī)器學(xué)習(xí)模型的大小,以便在更小的設(shè)備上驅(qū)動(dòng)人工智能,但其引用的示例主要涉及計(jì)算機(jī)視覺。例如,幫助智能攝像頭或自動(dòng)駕駛汽車識(shí)別周圍的物體,是汽車實(shí)現(xiàn)自動(dòng)駕駛的關(guān)鍵技術(shù)之一。 值得一提的是,OmniML的三位聯(lián)合創(chuàng)始人本科均畢業(yè)于清華大學(xué),分別是麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)教授韓松、Meta前軟件工程師吳迪,以及參與發(fā)明深度壓縮技術(shù)的毛慧子。 除了上述“強(qiáng)鏈補(bǔ)鏈”式收購,英偉達(dá)也曾啟動(dòng)收購移動(dòng)芯片巨頭,借以重回移動(dòng)領(lǐng)域。 籌劃收購ARM(ARM.O),是英偉達(dá)歷史上最受矚目的收購計(jì)劃。 ARM是一家移動(dòng)端CPU芯片和架構(gòu)供應(yīng)商,全球99%的智能手機(jī)和89%的平板電腦使用其芯片架構(gòu),其成立至2022年末,芯片出貨量超過2500億顆。一直面向PC客戶端的英偉達(dá),如果收購ARM,將實(shí)現(xiàn)其在移動(dòng)端的業(yè)務(wù)突破,覆蓋PC和移動(dòng)端客戶,成為芯片領(lǐng)域真正的“壟斷者”。 收購的機(jī)會(huì)由ARM控股股東軟銀釋放。2020年9月14日,因多筆投資價(jià)值大縮水而在2019財(cái)年出現(xiàn)成立15年來首次虧損(虧損130億美元)的軟銀,為緩解財(cái)務(wù)壓力,宣布將ARM以400億美元對(duì)價(jià)出售給英偉達(dá)。但這一交易計(jì)劃自帶的“壟斷”屬性,很快遭到ARM公司創(chuàng)始人赫曼·豪瑟(Hermann Hauser)和英國、歐洲、美國和中國的監(jiān)管機(jī)構(gòu)以及高通、微軟、谷歌等公司的反對(duì)。2023年2月9日,英偉達(dá)正式宣布放棄該項(xiàng)收購,軟銀轉(zhuǎn)而推動(dòng)ARM獨(dú)立上市。2023年9月14日,ARM在納斯達(dá)克上市,創(chuàng)下2023年全球最大規(guī)模IPO紀(jì)錄。ARM最新市值為515億美元。 長期堅(jiān)守內(nèi)部研發(fā)和外部收購,造就了如今擁有算力生態(tài)系統(tǒng)的英偉達(dá)。那么,需要提問的是,英偉達(dá)有哪些“軟肋”限制其未來發(fā)展呢? 04、輕資產(chǎn)代工生產(chǎn)模式, 兩大環(huán)節(jié)“卡脖子” AI風(fēng)口上,GPU是一個(gè)賣方市場。 大模型訓(xùn)練的“入門級(jí)”算力支撐,至少需要1000顆A100芯片。GPT-3模型訓(xùn)練采用的超級(jí)計(jì)算機(jī),則需搭載數(shù)萬顆英偉達(dá)A100芯片,而升級(jí)后的大模型需要的芯片更多。因此,創(chuàng)建大模型的第一門檻,就是芯片的數(shù)量和芯片價(jià)格。 供不應(yīng)求下,2022年12月至2023年6月的半年內(nèi),英偉達(dá)A100價(jià)格累計(jì)漲幅近70%。英偉達(dá)H100的單價(jià)在2023年8月末超過了4.5萬美元,專業(yè)機(jī)構(gòu)推算,其成本約3000美元,利潤率達(dá)1400%。 這樣的暴利產(chǎn)品,當(dāng)然大賣特賣最好,讓利潤漲到天上去。但是,高端芯片的生產(chǎn)工藝復(fù)雜度和產(chǎn)品良率幾乎成反比,英偉達(dá)“生產(chǎn)”不出來市場所需的芯片。站在產(chǎn)業(yè)鏈頂端的科技巨頭,正在遭遇“卡脖子”。 芯片行業(yè)如同所有高端制造業(yè),有重資產(chǎn)一體化模式,也有輕資產(chǎn)的代工模式,前者的代表如英特爾(僅20%的產(chǎn)品由外部代工),后者代表如英偉達(dá),雖然二者的產(chǎn)品結(jié)構(gòu)不同,但隨著高端產(chǎn)品占比提高以及出品規(guī)模增長,2020年開始,英偉達(dá)的凈利率超過了英特爾,2023年上半年,差距進(jìn)一步拉大(圖9)。 作為一家專注芯片設(shè)計(jì)和銷售的公司,英偉達(dá)生產(chǎn)上依靠臺(tái)積電等供應(yīng)商,其芯片產(chǎn)品升級(jí)迭代中,生產(chǎn)環(huán)節(jié)的復(fù)雜度和生產(chǎn)工藝的難度往往呈非線性增長,需要整個(gè)供應(yīng)鏈的合力支持,甚至面臨供應(yīng)鏈的重構(gòu)(表4)。 這就導(dǎo)致,在外包生產(chǎn)的輕資產(chǎn)模式中,如果代工廠遭遇生產(chǎn)效率低下或排產(chǎn)限制等問題,產(chǎn)品就會(huì)無法按期量產(chǎn)或交付延期。早在2012年,英偉達(dá)即出現(xiàn)過產(chǎn)品因代工廠原因而供不應(yīng)求的問題。2012年一季度,由于臺(tái)積電28納米開普勒(Kepler)GPU容量限制,英偉達(dá)無法滿足客戶對(duì)高端臺(tái)式機(jī)GPU產(chǎn)品的需求,導(dǎo)致當(dāng)季營收下降4%,凈利潤下降55.3%,一直持續(xù)到2013年一季度才重回正增長軌道。 截至2023年1月,對(duì)臺(tái)積電營收貢獻(xiàn)排名前10的客戶分別是蘋果、聯(lián)發(fā)科、AMD、高通、博通、英偉達(dá)、Marvel、意法半導(dǎo)體、亞德諾、英特爾。2020-2022年,其來自最大單一客戶蘋果的銷售金額由3367.76億元新臺(tái)幣增至5296.5億元新臺(tái)幣,增長57%,但蘋果占臺(tái)積電總營收的比重由25%降至23%。由此可見,臺(tái)積電的客戶集中度在下降,單一大客戶很難對(duì)其業(yè)績構(gòu)成特別重大影響。 針對(duì)客戶對(duì)臺(tái)積電的產(chǎn)能占有問題,臺(tái)積電在2023年財(cái)報(bào)中明確表示,由于設(shè)計(jì)技術(shù)和功能的快速變化,代工客戶一般不會(huì)提前很多時(shí)間下采購訂單來制造產(chǎn)品,但是一部分客戶與其達(dá)成協(xié)議,通過支付臨時(shí)費(fèi)用以獲得臺(tái)積電晶圓廠的指定產(chǎn)能。 這意味著,臺(tái)積電的排產(chǎn)計(jì)劃中,預(yù)留了臨時(shí)付費(fèi)增產(chǎn)的空間。據(jù)悉,臺(tái)積電正以超級(jí)急件(superhotrun)生產(chǎn)英偉達(dá)GPU,但H100和A100的訂單已經(jīng)排到2024年二季度,即現(xiàn)在下訂單,明年年中才能收貨。 一般而言,芯片的性能與晶體管的數(shù)量正相關(guān),但單位面積的硅片上晶體管排布越多,能耗越大散熱問題越突出,產(chǎn)品良率也越低,因此芯片設(shè)計(jì)的關(guān)鍵在于性能與能耗必須達(dá)成平衡。 以服務(wù)于超級(jí)加速器的芯片H100為例,其是由超過3.5萬個(gè)零件和近1萬億個(gè)晶體管組成的系統(tǒng)組件,內(nèi)部設(shè)計(jì)的復(fù)雜程度,外行難以想象。 拆分芯片結(jié)構(gòu),H100主要由邏輯芯片、HBM存儲(chǔ)芯片、CoWoS封裝、PCB板等輔助器件組成。目前,封裝和存儲(chǔ)芯片是兩大“卡脖子”環(huán)節(jié)。 我們以H100最通用的版本H100 SXM為例,其采用的是臺(tái)積電CoWoS的7晶粒封裝,存儲(chǔ)芯片則是6顆16G的HBM3芯片分列兩排、圍繞中間的邏輯芯片。 首先,臺(tái)積電CoWoS封裝是一種2.5D封裝工藝,能將計(jì)算、內(nèi)存等晶片堆疊到硅中介層或硅轉(zhuǎn)接板,通過硅中介層上的高密度布線,實(shí)現(xiàn)晶片互連,再安裝到基板上進(jìn)行封裝。這提升了芯片的連接速度、降低了功耗,相較直接在芯片上打孔、布線的3D封裝工藝,其成本更低、散熱更優(yōu),數(shù)據(jù)吞吐帶寬更寬,幾乎是市場上高算力、高存儲(chǔ)芯片的唯一封裝工藝。 目前,英偉達(dá)、AMD的4款高性能GPU均采用這一封裝工藝。但臺(tái)積電該封裝工藝產(chǎn)能不足,且目前幾無可替代廠商,這限制了英偉達(dá)相關(guān)產(chǎn)品的產(chǎn)量,預(yù)計(jì)2024年,三星或可提供該封裝服務(wù)。 按照集邦咨詢預(yù)測,臺(tái)積電正在擴(kuò)產(chǎn)能,其CoWoS月產(chǎn)能將在2023年底達(dá)到1.2萬片,即便是臺(tái)積電把CoWoS產(chǎn)能都排給英偉達(dá),英偉達(dá)高端芯片產(chǎn)能的天花板也僅是1.2萬片/月。因此,解決了封裝環(huán)節(jié)的限制,高端芯片的出貨量才會(huì)增加。 其次,存儲(chǔ)芯片供應(yīng)不足。H100中的6顆HBM3存儲(chǔ)芯片,由韓國SK海力士獨(dú)家供應(yīng)。一張H100 SXM使用6顆HBM3存儲(chǔ)芯片的成本約1500美元。2023年上半年,三星的HBM3量產(chǎn)出貨加快,存儲(chǔ)芯片在2023年下半年后或不再限制H100出貨量。 一塊H100重達(dá)70磅,這幾乎是今年市場上唯一用“體重”計(jì)量的芯片產(chǎn)品,其2023年二季度出貨量超過了900噸。從長期來看,H100的供需缺口會(huì)隨著AIGC的應(yīng)用爆發(fā)而水漲船高。根據(jù)金融時(shí)報(bào)的報(bào)道,2024年H100的出貨量預(yù)計(jì)將高達(dá)150萬-200萬張,相比于2023年的50萬張?zhí)嵘?-4倍。有華爾街投行預(yù)測,2024年英偉達(dá)“A+H”系列顯卡的出貨量合計(jì)將達(dá)到300萬-500萬張。 得益于H100等高性能產(chǎn)品的拉動(dòng),2023年二季度,英偉達(dá)的毛利率達(dá)到68.2%,較2022年末的56.9%提高了11.3個(gè)百分點(diǎn),創(chuàng)歷史新高,且高于直接競爭對(duì)手英特爾和AMD(圖10)。英偉達(dá)的毛利率,在Wind美股半導(dǎo)體設(shè)備與產(chǎn)品分類的104家公司中,排名第10。排名前9的公司中,6家2022年凈利潤錄得虧損,僅博通(AVGO.O)的凈利潤高于英偉達(dá)。 令競爭對(duì)手不寒而栗的是,H100和A100產(chǎn)能尚在爬坡階段,英偉達(dá)性能更強(qiáng)的新產(chǎn)品又來了,一場看不見硝煙的算力戰(zhàn)爭正在發(fā)生。 05、黃氏定律挑戰(zhàn)摩爾定律, 算力會(huì)鎖死嗎? 順周期航程中,站在頭部的巨頭,只會(huì)加速。 2023年8月初,在美國計(jì)算機(jī)協(xié)會(huì)計(jì)算機(jī)圖形圖像特別興趣小組(Special Interest Group for Computer GRAPHICS,簡稱“SIGGRAPH”)組織的2023年年會(huì)上,英偉達(dá)發(fā)布了基于Grace Hopper架構(gòu)、搭載的存儲(chǔ)器為全球首款HBM3e(較HBM3快50%)處理器的新顯卡GH200,可用于處理大語言模型、推薦系統(tǒng)、矢量數(shù)據(jù)庫等全球最復(fù)雜的AIGC工作負(fù)載所需。該芯片配備141GB內(nèi)存、72核ARM中央處理器和每秒5TB的帶寬,較H100芯片內(nèi)存增加1.7倍,傳輸頻寬增加1.5倍。 GH200已于2023年5月全面投產(chǎn),基于GH200 Grace Hopper平臺(tái)的新系統(tǒng)將于2024年第二季度開始交付。 對(duì)于使用者來說,投資800萬美元使用Grace Hopper,相當(dāng)于使用8800個(gè)價(jià)值1億美元的X86 GPU,整體成本降低12倍、能耗降低20倍。這也是黃仁勛說的“買的越多越省”的原因。 需要強(qiáng)調(diào)的是,英偉達(dá)的新平臺(tái)依舊延續(xù)兼容模式,客戶可以通過英偉達(dá)NVLink與其他超級(jí)芯片連接、協(xié)同工作,進(jìn)而部署大型AIGC模型。因此,英偉達(dá)的一致性技術(shù)使GPU可以訪問CPU內(nèi)存,在雙配置中可提供總計(jì)1.2TB的快速內(nèi)存。 這無疑進(jìn)一步加大了使用者改換GPU和平臺(tái)的難度和成本。用戶忠誠度“被動(dòng)”加固。 那么,英偉達(dá)GPU芯片的性能升級(jí)會(huì)永無止境嗎? 芯片性能提升過程中,晶體管數(shù)量增加的規(guī)律誕生了一個(gè)摩爾定律,即集成電路上可容納的元器件數(shù)目,約每隔18-24個(gè)月便會(huì)增加一倍,性能也將提升一倍。在客觀存在的物理限制下,整個(gè)行業(yè)間隔十多年便會(huì)出現(xiàn)困擾聰明大腦的問題,摩爾定律會(huì)不會(huì)失效、算力會(huì)不會(huì)鎖死? 2023年9月29日,英偉達(dá)發(fā)布的一篇博客稱,在過去10年中,英偉達(dá)GPU的AI處理能力增長了1000倍。由此,“單芯片推理性能”中看到的加速不會(huì)逐漸消失,理論上會(huì)繼續(xù)出現(xiàn),這一發(fā)現(xiàn)被業(yè)內(nèi)稱為“黃氏定律”。 短期內(nèi)算力不會(huì)鎖死,但AI大模型最強(qiáng)助攻的英偉達(dá),如果其顯卡所有環(huán)節(jié)都實(shí)現(xiàn)產(chǎn)能自由,那么,根據(jù)工業(yè)品規(guī)?;a(chǎn)的萊特定律,產(chǎn)品累積產(chǎn)量翻倍,單位成本將下降固定百分比。 例如,汽車行業(yè),整車廠產(chǎn)量翻倍,其成本價(jià)格就會(huì)下降15%。據(jù)相關(guān)機(jī)構(gòu)測算,在芯片行業(yè)中,晶圓產(chǎn)量翻倍,成本下降約22%。如果技術(shù)迭代,比如芯片從10納米迭代到7納米技術(shù),交付處理器的最終成本每年可以下降30%-33%。 正如臺(tái)積電2023財(cái)年年報(bào)所示,當(dāng)其產(chǎn)能利用率增加時(shí),固定制造成本會(huì)分?jǐn)偟礁蟮漠a(chǎn)量上,產(chǎn)量越大,單位成本越低。為了提升芯片制造效率,針對(duì)當(dāng)前的SoC開發(fā)方法,臺(tái)積電開發(fā)了多項(xiàng)晶圓加工程序,多個(gè)客戶可以共用掩膜(mask芯片制造中的模具),從而降低客戶的原型成本、縮短產(chǎn)品上市周期。 英偉達(dá)與臺(tái)積電在長期合作中,學(xué)習(xí)曲線效應(yīng)與技術(shù)難度升級(jí)共振,彼此均獲得了不可替代的優(yōu)勢。這也是AI芯片賽道上,英偉達(dá)被英特爾、 AMD、微軟、谷歌等巨頭追趕多年,卻尚未被超越的根本原因,而臺(tái)積電也越來越難被替代。 但是,產(chǎn)能受限的英偉達(dá),必然無法獨(dú)吞未來10年AI算力芯片的萬億市場蛋糕,哪些公司將會(huì)是英偉達(dá)強(qiáng)勁的對(duì)手呢? 06、算力行業(yè)競爭加劇, 英偉達(dá)要做“AI界的臺(tái)積電” 全球GDP增長乏力的背景下,數(shù)字經(jīng)濟(jì)保持強(qiáng)勁增長。發(fā)展數(shù)字經(jīng)濟(jì),算力是核心生產(chǎn)力,未來很長一段時(shí)間,投資算力將對(duì)經(jīng)濟(jì)增長產(chǎn)生倍增效應(yīng)?!?022-2023年全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,算力指數(shù)平均提高1個(gè)百分點(diǎn),該國的數(shù)字經(jīng)濟(jì)和GDP將分別增長 3.6‰和1.7‰。 算力已成為經(jīng)濟(jì)增長的主要驅(qū)動(dòng)力之一,且全球主要國家數(shù)字經(jīng)濟(jì)占GDP的比重持續(xù)增長。2022-2026年,該比重預(yù)計(jì)將從50.2%增長到54%。其中,2022年中國AI算力規(guī)模達(dá)到268百億億次/秒,超過通用算力規(guī)模。預(yù)計(jì)未來5年中國智能算力規(guī)模的年復(fù)合增長率將達(dá)52.3%。 熱門賽道上,從來沒有獨(dú)一份的生意,即使是在算力世界“廣積糧高筑墻”的英偉達(dá),也面臨競爭對(duì)手的追擊。 競品頻出,AI算力市場風(fēng)起云涌 目前,英偉達(dá)主要的競爭對(duì)手有兩類:一是以AMD和英特爾為代表的解決方案供應(yīng)商和許可方;二是以谷歌、亞馬遜、微軟為代表的大型云服務(wù)商。 首先,專業(yè)處理器陣營第一梯隊(duì)的英特爾和AMD,2023年均已推出對(duì)標(biāo)英偉達(dá)H100的產(chǎn)品和對(duì)標(biāo)CUDA的軟件系統(tǒng)。 為應(yīng)對(duì)AI時(shí)代的算力需求,2023年7月,英特爾推出面向中國市場的第二代Gaudi深度學(xué)習(xí)加速器Habana Gaudi 2,用于AI訓(xùn)練,意在爭奪“百模大戰(zhàn)”的中國市場。 目前,英特爾數(shù)據(jù)中心有兩大系列產(chǎn)品,Gaudi系列為人工智能加速領(lǐng)域中的專屬產(chǎn)品,適用于大模型的工作負(fù)載,Max系列GPU適用于科學(xué)計(jì)算領(lǐng)域。預(yù)計(jì)到2025年,英特爾將把兩條產(chǎn)品線融合,推出結(jié)合第二代Gaudi的GPU產(chǎn)品。 2023年9月19日,Intel On技術(shù)創(chuàng)新大會(huì)上,英特爾CEO基辛格(Pat Gelsinger)披露了5nm AI芯片Gaudi 3,該芯片將于2024年推出。同時(shí),基辛格還預(yù)覽了第五代英特爾至強(qiáng)可擴(kuò)展CPU處理器,其較第四代的AI性能提升2-3倍。阿里巴巴的“阿里云通義千問大模型”,使用的即是英特爾第四代至強(qiáng)處理器。 英特爾還宣布與ARM合作推出AI推理和部署運(yùn)行工具套件OpenVINO,不僅支持預(yù)訓(xùn)練模型,也支持跨平臺(tái)應(yīng)用,以構(gòu)建其軟件生態(tài)。 值得一提的是,早在2021年12月,英特爾已推出了one API,作為其“軟件先行”戰(zhàn)略的重要一步。one API是一個(gè)統(tǒng)一簡化的編程模型,旨在簡化跨多架構(gòu)的開發(fā)過程(如CPU、GPU、FPGA、加速器),建立類似英偉達(dá)CUDA的軟件橋梁。 2023年9月19日,英特爾的軟件計(jì)劃迎來新的跨越,Linux基金會(huì)宣布,成立統(tǒng)一加速UXL基金會(huì)。這是一個(gè)跨行業(yè)組織,致力于提供一個(gè)開放的標(biāo)準(zhǔn)加速器編程模型,簡化開發(fā)高性能、跨平臺(tái)應(yīng)用程序的過程,其核心是加速演進(jìn)英特爾one API計(jì)劃。 該基金會(huì)的參與組織包括ARM、富士通、谷歌云、英特爾、高通、三星、Imagination Technologies(2017年被凱橋資本以5.5億英鎊收購)等公司,不包括英偉達(dá)。簡單概括,這些芯片公司試圖建立一個(gè)更大更開放的生態(tài)系統(tǒng),角力英偉達(dá)的生態(tài)系統(tǒng)。 GPU二號(hào)玩家AMD,2023年6月推出Instinct MI 300A和Instinct MI300X兩款加速顯卡,用于AI和高性能計(jì)算等領(lǐng)域。 前者是全球首個(gè)為AI和高性能計(jì)算打造的APU加速卡,也是AMD首款采用“CPU+GPU+內(nèi)存”的一體化組合產(chǎn)品,其中包含1460億個(gè)晶體管、24個(gè)Zen 4 CPU核心、1個(gè)CDNA 3圖形引擎和128GB HBM3內(nèi)存。后者則是對(duì)標(biāo)英偉達(dá)H100、面向AIGC推出的加速器,內(nèi)含1530億個(gè)晶體管,單卡可支持400億參數(shù)的大模型,其顯存容量和帶寬均超越H100,是AMD產(chǎn)品史上最大的芯片產(chǎn)品,預(yù)計(jì)將于2023年四季度量產(chǎn)。 除此之外,AMD還推出集合了8個(gè)MI 300X的Instinct Platform,對(duì)標(biāo)英偉達(dá)CUDA,同樣以軟硬一體化模式提供AI算力解決方案。 其次,向英偉達(dá)貢獻(xiàn)萬顆芯片訂單的云商大客戶,也紛紛自研AI芯片。 云服務(wù)是能夠?qū)I三要素(數(shù)據(jù)、計(jì)算和模型)融合的最佳模式。微軟AWS、亞馬遜Azure、谷歌云等大型云服務(wù)商,正在自研芯片和AI模型,以降低使用算力與模型服務(wù)的成本。 以最早研發(fā)AI芯片的谷歌為例,早在2016年,其數(shù)據(jù)中心已推出TPU,2023年4月推出AI芯片TPU V4,比英偉達(dá)A100處理速度快1.2-1.7倍,功耗卻低1.3-1.9倍。更重要的是,谷歌已將AI芯片團(tuán)隊(duì)調(diào)整至谷歌云團(tuán)隊(duì)中,以提高谷歌云AI芯片的租用服務(wù)能力。 同樣,華為也提出全面智能化戰(zhàn)略,打造中國堅(jiān)實(shí)的算力底座,為世界構(gòu)建第二選擇。有消息稱,華為的GPU技術(shù)能力已可以對(duì)標(biāo)英偉達(dá),其昇騰910芯片性能可對(duì)標(biāo)A100。 而微軟則因?yàn)橥顿Y了OpenAI而躍升為大贏家,從Bing到Office再到Windows,微軟不斷將OpenAI的技術(shù)置入旗下產(chǎn)品,風(fēng)頭壓過了谷歌。2023年二季度,微軟云全球市場份額達(dá)26%。2023財(cái)年,微軟云收入同比增長22%至1116億美元。持續(xù)增長的微軟云,未來有望超越市場份額30%的亞馬遜云。 作為OpenAI的獨(dú)家云供應(yīng)商,微軟Azure支持OpenAI的所有工作負(fù)載。同時(shí),微軟也增加了對(duì)專業(yè)超級(jí)計(jì)算機(jī)系統(tǒng)的開發(fā)和部署的投資,以加速OpenAI的相關(guān)研究。 微軟已宣布,對(duì)其生產(chǎn)力軟件中的AIGC功能收取30美元/月的費(fèi)用,云計(jì)算與大模型的疊加效應(yīng)已經(jīng)為其帶來實(shí)實(shí)在在的收益。 面對(duì)日益高昂的算力費(fèi)用,微軟也將于2023年11月推出AI芯片“雅典娜(Athena)”,用于其數(shù)據(jù)中心服務(wù)器,并可用于ChatGPT訓(xùn)練,從而降低微軟內(nèi)部和OpenAI大模型訓(xùn)練和推理的成本,減少對(duì)英偉達(dá)芯片的依賴。 面對(duì)科技巨頭的競爭與追趕,英偉達(dá)也在延伸服務(wù)鏈條,降低其產(chǎn)品的使用門檻和可觸達(dá)性。 向云服務(wù)延伸,對(duì)標(biāo)臺(tái)積電 AI時(shí)代,高性能的算力配置價(jià)格高昂,大模型訓(xùn)練成本動(dòng)輒成千上百萬美元,并不是所有公司都擁有入場資格。 自2020年以來,OpenAI在其最大的支持者微軟建造的大型超級(jí)計(jì)算機(jī)上,開發(fā)了AIGC技術(shù),該計(jì)算機(jī)使用了1萬顆英偉達(dá)的GPU。現(xiàn)在建造這樣一臺(tái)超級(jí)計(jì)算機(jī),僅GPU成本已近20億元。 Bernstein分析師斯泰西·拉斯貢(Stacy Rasgon)分析,運(yùn)行ChatGPT是非常昂貴的,每次查詢大約花費(fèi)4美分,如果ChatGPT的搜索量增長到谷歌搜索量的1/10,它將需要大約價(jià)值481億美元的GPU,每年需要價(jià)值約160億美元的芯片來維持運(yùn)行。隨著英偉達(dá)GPU供不應(yīng)求、價(jià)格飆漲,OpenAI不少短期計(jì)劃被迫推遲。有報(bào)道顯示,OpenAI正在探索自研AI芯片,并有意收購一家芯片公司,解決被芯片短缺限制進(jìn)程的障礙。 成本高昂,但每一個(gè)企業(yè)都需要大模型和AI服務(wù),這是增長潛力巨大的長尾市場。 為此,黃仁勛提出英偉達(dá)要做“AI界的臺(tái)積電”,通過與大模型廠商、云廠商合作提供高性價(jià)比的云服務(wù)解決方案,幫助下游企業(yè)降低大模型訓(xùn)練成本。 向云業(yè)務(wù)延伸的英偉達(dá),推出云服務(wù)相關(guān)模型的動(dòng)作迅速,一手合作、一手投資。 2022年8月,英偉達(dá)發(fā)布原生AI模型Omniverse Avatar Cloud Engine(ACE),任何規(guī)模的企業(yè)都能夠通過其云端的模型和服務(wù)即時(shí)獲得創(chuàng)建并部署虛擬助手和數(shù)字人所需的大規(guī)模算力。 2023年3月,英偉達(dá)推出用于自定義AI基礎(chǔ)模型的AIGC云服務(wù)BioNeMo,能夠加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學(xué)、化學(xué)、生物學(xué)和分子動(dòng)力學(xué)等領(lǐng)域的研究。 2023年3月,英偉達(dá)宣布推出包括NVIDIA NeMo、NVIDIA Picasso和NVIDIA BioNemo在內(nèi)的一整套云服務(wù),使企業(yè)能夠構(gòu)建、完善和運(yùn)行自定義大型語言模型和AIGC模型。 與此同時(shí),英偉達(dá)與微軟、谷歌、甲骨文等云計(jì)算巨頭合作托管其DGX Cloud,合力提升超大規(guī)模云的性能。用戶無需采購和擁有服務(wù)器,可以通過瀏覽器訪問DGX Cloud,包括AI超級(jí)計(jì)算、AI框架、預(yù)訓(xùn)練模型服務(wù),DGX Cloud的收費(fèi)標(biāo)準(zhǔn)是每個(gè)實(shí)例36999美元/月起,每個(gè)實(shí)例包括8個(gè)H100或A100 80GB GPU,每個(gè)GPU節(jié)點(diǎn)內(nèi)存達(dá)640 GB,且計(jì)算資源專用,不與云中另外的租戶共享。 除了與大型云服務(wù)商合作外,英偉達(dá)還密集投資了云服務(wù)初創(chuàng)公司。 投資標(biāo)的之一是“算力黃?!盋oreWeave。成立于2016年的CoreWeave,起初業(yè)務(wù)單一,就是用算力“挖礦”,其向英偉達(dá)采購了大量GPU組建礦機(jī)中心,并在幣圈低潮期逆周期囤積了大量GPU,一路將自己買成了英偉達(dá)的“VIP”,享有英偉達(dá)顯卡優(yōu)先配貨權(quán)。 2019年,CoreWeave將礦機(jī)中心改造為企業(yè)級(jí)數(shù)據(jù)中心,為企業(yè)級(jí)GPU加速工作負(fù)載提供AI云服務(wù)或者為計(jì)算密集型用例構(gòu)建云解決方案算力,比大型公有云快35倍,但價(jià)格便宜80%。 2023年,隨著ChatGPT爆火,英偉達(dá)顯卡市場緊俏,連馬斯克都在2023年4月成立X.AI公司,加入AI混戰(zhàn)。賣方市場下,誕生了GPU租賃服務(wù),英偉達(dá)GPU成為可抵押融資的“硬通貨”。 2023年8月,CoreWeave抵押其擁有的英偉達(dá)H100顯卡,從黑石等機(jī)構(gòu)獲得23億美元債務(wù)融資,公司估值達(dá)到80億美元。此前2023年4月,CoreWeave完成4.21億美元的B輪融資,投資者包括英偉達(dá),彼時(shí)其估值僅20億美元。4個(gè)月時(shí)間,其估值放大了3倍,足見這個(gè)市場的熱度。 2023年6月末,黃仁勛宣布與云計(jì)算巨頭Snowflake合作,售賣英偉達(dá)的軟件和模型服務(wù)。2023年9月有媒體透露,英偉達(dá)正計(jì)劃向云服務(wù)商Lambda Labs投資3億美元,Lambda Labs最早業(yè)務(wù)是銷售GPU驅(qū)動(dòng)的計(jì)算機(jī),后轉(zhuǎn)型為GPU云服務(wù)器租賃,目前主要面向企業(yè)出租帶有英偉達(dá)芯片的服務(wù)器,從而與亞馬遜、微軟、谷歌等云服務(wù)商展開競爭。 從谷歌、微軟等科技公司的AI布局可以看到,云服務(wù)是AI業(yè)務(wù)落地的重要抓手和橋梁,英偉達(dá)在云服務(wù)上的研發(fā)、合作、投資將不會(huì)停止。 07、頻密投資完善產(chǎn)業(yè)鏈, 英偉達(dá)AI生態(tài)圈擴(kuò)容 業(yè)績大好的英偉達(dá),正在以投資的方式構(gòu)建以AI為核心的生態(tài)圈。 截至2023年7月31日,英偉達(dá)賬面趴著58億美元現(xiàn)金和現(xiàn)金等價(jià)物,較2022年末的34億美元增長了71%。足夠的錢,是英偉達(dá)對(duì)外投資的基礎(chǔ)。 不差錢的英偉達(dá),2023年前9個(gè)月參與了至少20家AI初創(chuàng)公司的融資,堪比風(fēng)投機(jī)構(gòu)。要知道,全球最大的獨(dú)角獸投資者之一的老虎環(huán)球基金(Tiger Global Management)同期也僅投資了30家標(biāo)的。 其中,AIGC是英偉達(dá)投資的主要賽道,2023年英偉達(dá)投資了8家相關(guān)公司(表5)。這8家公司已在AI領(lǐng)域做出領(lǐng)先產(chǎn)品,其中不乏Inflection AI和Imbue等英偉達(dá)的下游客戶。 例如,在2023年6月30日完成13億美元融資的Inflection AI,投資者包括微軟、英偉達(dá)和三名個(gè)人投資者。融資完成后,其歷史總?cè)谫Y額達(dá)15.25億美元,成為融資金額僅次于OpenAI的AIGC初創(chuàng)公司。 該公司由谷歌AI實(shí)驗(yàn)室DeepMind創(chuàng)始人之一的穆斯塔法?蘇萊曼(Mustafa Suleyman)于2022年1月離開谷歌后創(chuàng)立,2023年5月即推出首款產(chǎn)品——名為Pi的AI個(gè)人助理,6月發(fā)布支持Pi的AI模型Inflection-1,被視為OpenAI勁敵之一。 穆斯塔法?蘇萊曼稱,英偉達(dá)和CoreWeave正在為公司部署數(shù)千個(gè)H100 GPU,投入使用后Inflection的新集群將運(yùn)行2.2萬個(gè)H100 GPU,超過Meta公司的1.6萬個(gè)GPU集群。 另外,融資到I輪、估值超過430億美元的Databrick,2023年3月發(fā)布ToB端的語言大模型Dolly,4月發(fā)布Dolly2.0,可用于構(gòu)建商業(yè)應(yīng)用程序,有望在B2B生成式AI應(yīng)用爆發(fā)式增長時(shí)期占得先機(jī)。2023年6月,其以13億美元的對(duì)價(jià)收購了開源大模型公司MosaicML,該標(biāo)的也是OpenAI的勁敵之一。強(qiáng)強(qiáng)聯(lián)合后,Databrick在AI領(lǐng)域的實(shí)力更強(qiáng),IPO或?qū)⑻嵘先粘獭?/p> AIGC之外,醫(yī)藥AI是英偉達(dá)聚焦投資的另一核心賽道。據(jù)bioSeedin不完全統(tǒng)計(jì),2023年8月、9月及10月第一周,共有29家AI制藥企業(yè)完成新一輪融資,披露融資總金額超過16億美元,達(dá)到2021年醫(yī)藥公司融資巔峰期的1/3,其中6家公司獲得了英偉達(dá)的投資(表6)。 例如,上市公司Recursion(RXRX.O)獲得英偉達(dá)5000萬美元投資后,宣布將利用英偉達(dá)的AIGC云服務(wù)來加速AI在生物和化學(xué)領(lǐng)域的基礎(chǔ)模型開發(fā),而Recursion也能通過自身龐大的數(shù)據(jù)來不斷訓(xùn)練英偉達(dá)的AI模型。Iambic Therapeutics宣布將利用英偉達(dá)的DGX Cloud AI超級(jí)計(jì)算平臺(tái)和BioNeMo云服務(wù),加速其藥物研發(fā)。 作為熟知AI技術(shù)路線的產(chǎn)業(yè)投資者,英偉達(dá)通過投資AI領(lǐng)域的初創(chuàng)企業(yè),并推動(dòng)這些企業(yè)的發(fā)展,一方面有助于其緊跟前沿賽道的產(chǎn)品需求,不斷迭代技術(shù),保持競爭優(yōu)勢,另一方面,成為AI前沿賽道公司的股東后,這些獨(dú)角獸無論繼續(xù)融資還是上市,英偉達(dá)都將獲得不菲的投資收益。 Wind數(shù)據(jù)顯示,美股披露相關(guān)數(shù)據(jù)的88家半導(dǎo)體及半導(dǎo)體設(shè)備上市公司中,2023年10月20日的收盤價(jià)高于發(fā)行價(jià)的占比64%。由此可見,英偉達(dá)的投資從開端就大概率會(huì)實(shí)現(xiàn)雙贏。 除了投資AI下游應(yīng)用型企業(yè)外,英偉達(dá)同時(shí)向上參與光刻機(jī)制造。2023年,英偉達(dá)與臺(tái)積電、ASML、新思合作發(fā)布了計(jì)算光刻庫cuLitho。cuLitho可以通過部署有大量GPU的DGX AI計(jì)算系統(tǒng)對(duì)計(jì)算光刻(在芯片設(shè)計(jì)和制造領(lǐng)域的關(guān)鍵步驟,也是最大的計(jì)算負(fù)載之一)進(jìn)行加速,使其達(dá)到基于CPU計(jì)算速度的幾十倍,同時(shí)降低計(jì)算過程的總能耗,有助于晶圓廠縮短原型周期時(shí)間、提高產(chǎn)量、減少碳排放,將長期影響產(chǎn)業(yè)發(fā)展并累積形成代際差。 以GPU為核心,英偉達(dá)向上下游延伸業(yè)務(wù),打造更龐大的AI生態(tài)圈,它也因此成為AI產(chǎn)業(yè)鏈上更重要的存在。 08、股價(jià)高位回調(diào)12%, 英偉達(dá)高增長可持續(xù)嗎? 在算力領(lǐng)域全面出擊的英偉達(dá),也不可避免被投資者投了看空票。多位投資人認(rèn)為,受產(chǎn)能限制,英偉達(dá)的股價(jià)已提前兌現(xiàn)了未來的業(yè)績增長。 我們先看美股半導(dǎo)體行業(yè)的整體走勢。受益于OpenAI推出的ChatGPT大模型推動(dòng),2022年11月末至2023年7月末,費(fèi)城半導(dǎo)體指數(shù)、標(biāo)普500指數(shù)、納斯達(dá)克100指數(shù)均走出了氣勢如虹的上揚(yáng)線,費(fèi)城半導(dǎo)體指數(shù)更終結(jié)了此前9個(gè)月下跌40%的萎靡(2021年12月至2022年9月),但仍未回升到2021年12月的歷史高點(diǎn)(圖11)。 芯片行業(yè)整體仍處在蕭條期。Wind數(shù)據(jù)顯示,截至2023年10月20日,已披露2023年二季度業(yè)績的美股93家半導(dǎo)體企業(yè)中,35家企業(yè)錄得虧損。其中,英特爾虧損12.77億美元,AMD虧損1.12億美元,美光、安霸虧損額均呈現(xiàn)逐季擴(kuò)大趨勢(表7)。盈利的高通,凈利潤也同比下滑42.9%。 除了虧損問題,存貨飆漲成為困擾美股半導(dǎo)體企業(yè)的另一個(gè)問題。2022年末,英特爾的存貨達(dá)到132億美元。2023年6月末,高通存貨達(dá)69億美元。二者的存貨均創(chuàng)歷史新高。 韓國也不例外,其最大的芯片企業(yè)三星電子存貨連續(xù)3年攀升,至2023年6月末,存貨達(dá)3050億元,創(chuàng)歷史新高。2023年二季度,韓國第二大芯片企業(yè)SK海力士因需求疲軟,虧損2.9萬億韓元,同比下跌169%。 同行可比公司普遍承受業(yè)績下行和庫存飆漲的雙重壓力下,英偉達(dá)股價(jià)也由高點(diǎn)回調(diào)。2023年8月31日至9月29日,其股價(jià)下跌12%,總市值蒸發(fā)約1500億美元。同期,費(fèi)城半導(dǎo)體指數(shù)下跌6.5%,標(biāo)普500指數(shù)下跌5%。 值得注意的是,這一波回調(diào),發(fā)生在英偉達(dá)發(fā)布最好二季度業(yè)績和250億美元的股票回購計(jì)劃之后。 據(jù)報(bào)道,2023年10月9日,韓國總統(tǒng)辦公室通報(bào),美國同意三星電子和SK海力士向其位于中國的工廠提供設(shè)備,無需其他許可。這一變化或?qū)⑴まD(zhuǎn)兩家韓國企業(yè)的庫存和虧損問題。這無疑是對(duì)蕭條的芯片行業(yè)釋放的空前利好,英偉達(dá)股價(jià)此后連漲兩天。 但是,受拜登政府更新針對(duì)AI芯片的出口管制規(guī)定影響,費(fèi)城半導(dǎo)體指數(shù)、標(biāo)普500指數(shù)、納斯達(dá)克100指數(shù)一致下跌,英偉達(dá)市值4天內(nèi)蒸發(fā)1163億美元,股價(jià)下跌10%。 中國仍是芯片巨頭最大的單一市場。尤其是緊隨OpenAI,2023年中國科技公司興起“百模大戰(zhàn)”,更是釋放了對(duì)AI芯片的巨大需求。 中國AI頭號(hào)玩家百度,2023年初整合昆侖芯、太行DPU、飛槳深度學(xué)習(xí)框架、文心大模型、百度智能云等產(chǎn)品,構(gòu)建AI大底座。AI大底座將千卡并行加速比提升90%以上,訓(xùn)練場景資源利用率提升70%以上,模型開發(fā)迭代效率提升100%以上。目前,其萬卡訓(xùn)練集群的加速比達(dá)到95%,有效訓(xùn)練時(shí)間占比達(dá)到了96%,千帆平臺(tái)大模型調(diào)用量正以每周環(huán)比20%的增速攀升。 運(yùn)營商方面,中國電信將采購I系列/G系列訓(xùn)練型服務(wù)器總計(jì)4175臺(tái),InfiniBand交換機(jī)總計(jì)1182臺(tái)。中國移動(dòng)在上半年業(yè)績會(huì)上表示,正在建設(shè)亞洲最大的智算中心。 這些“基礎(chǔ)設(shè)施”的建設(shè)中,算力儲(chǔ)備至關(guān)重要,而大模型訓(xùn)練需要大量的英偉達(dá)GPU。百川智能創(chuàng)始人、CEO王小川曾對(duì)媒體分析指出,在大模型中,GPU的算力成本大概占40%-70%,而其中網(wǎng)絡(luò)連接成本和GPU顯卡成本的比例大概為3:1。而從大模型訓(xùn)練、推理兩部分看,國產(chǎn)AI芯片在數(shù)據(jù)推理上可以爭取實(shí)現(xiàn)國產(chǎn)替代。目前,在模型訓(xùn)練方面,英偉達(dá)做得最好。英偉達(dá)GPU在AI訓(xùn)練領(lǐng)域的市場份額達(dá)到95%,且暫時(shí)沒有可替代產(chǎn)品或方案。 更重要的是,國內(nèi)GPU企業(yè)面臨生態(tài)遷移的難題,眾多基于CUDA的代碼和程序,轉(zhuǎn)型新生態(tài)需要大量的時(shí)間和重建成本,以及處理兼容性難題。 有私有云公司的CEO在接受媒體采訪時(shí)說,他們的公司也想過轉(zhuǎn)去買AMD的顯卡,但要把這些顯卡調(diào)試到正常運(yùn)轉(zhuǎn)至少需要兩個(gè)月的時(shí)間。而為了縮短這兩個(gè)月,英偉達(dá)投入370億美元跑了30年。 因此,英偉達(dá)在AI算力的領(lǐng)先優(yōu)勢看起來仍將持續(xù)。而不斷增長的中國AI市場,或?qū)⒃俣瘸蔀槠錁I(yè)績增長的動(dòng)能。 可怕的是,英偉達(dá)還在奮力奔跑。2023年5月,其宣布推出一款新型大內(nèi)存AI超級(jí)計(jì)算機(jī),由NVIDIA GH200 Grace Hopper超級(jí)芯片和NVIDIA NVLink Switch System驅(qū)動(dòng)的NVIDIA DGX超級(jí)計(jì)算機(jī),旨在助力開發(fā)面向生成式AI語言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負(fù)載的巨型、下一代模型。 TO B端的英偉達(dá),與下游AI科技公司深度捆綁。未來,市場能否出現(xiàn)低成本的AI算力替換方案,或AI技術(shù)路線的顛覆性變革,挑戰(zhàn)其競爭優(yōu)勢,我們拭目以待。