2022年末,ChatGPT的火熱出圈,帶動了大模型和生成式AI的研發熱潮,高性能、高算力、低能耗的AI芯片銷量飆升,以英偉達A100、H100為代表的GPU芯片供不應求,推動其業績和市值雙雙創歷史新高,成為2023年躋身萬億美元市值俱樂部的新一代科技寡頭。
追溯英偉達的發展史,軟硬一體化是其商業模式的關鍵詞。其以GPU硬件縱向迭代為發展主軸,從定義顯卡的GeForce 256,到紙面算力達到1Exaflops(每秒進行百億億次浮點運算)的GH200芯片,其GPU產品性能緊貼客戶需求不斷升級,并擴展出GPU、CPU、DPU協同的硬件布局。軟件層面,其則通過開源的運算平臺CUDA,橫向開拓廣闊的應用市場,打造了與下游客戶不斷更新的需求相匹配的算力平臺,進而鏈接千行萬業,成為AI時代智能駕駛、智能云、大模型、生成式AI等科技巨頭背后的“賣鏟人”。
內部研發與外部收購并重,則是其保持技術領先的要訣。與所有科技巨頭一樣,其一手專注研發,成立以來累計研發投入超過370億美元,打造了內部技術迭代與進化的澎湃動能;一手頻頻外部收購,完善技術鏈條、延伸產業鏈,構建了強客戶黏性的算力生態系統。
有效的策略,推動英偉達在五次科技大風口中迎風起舞,20年間營收增長近14倍,凈利潤增長58倍。
隨著芯片產業整體競爭加劇,提出“做AI界的臺積電”新目標的英偉達,仍在加速奔跑。其一邊圍繞AI提升GPU硬件性能,擴大軟件生態,以快速迭代的新架構、新產品,加固其技術護城河,實現“贏家通吃”;一手加碼投資AI賽道獨角獸企業,擴張其AI生態圈,以合作雙贏深度綁定B端客戶,放大平臺優勢。
算力為王的時代,芯片是科技巨頭打造算力底座最核心的部件,微軟、谷歌、Meta、華為、百度等已自研AI芯片,并爭相構建AI生態。算力軍備賽中,英偉達的領先優勢將會持續多久呢?
來源:新財富雜志(ID:xcfplus)
作者:姬婧瑛
作為2023年市值增長最快的科技公司,英偉達(NVDA.O)備受各方關注。 2023年10月17日,拜登政府更新了針對AI芯片的出口管制規定,計劃阻止英偉達等公司向中國出口先進的AI芯片。其A800和H800等芯片均受影響,用于游戲市場的RTX4090系列顯卡在國內電商渠道已逐漸下架,存貨單價被炒高至5萬元。 AI時代,占據算力要沖的英偉達,2023年1至9月股價已翻了兩倍,市值達到10843億美元,替代特斯拉成為美股“萬億美元市值俱樂部”的“老五”,同時也是全球市值最高的芯片股。 為其提供芯片制造和封裝服務的臺積電(TSM.N,2330.TW),以4631億美元市值緊隨其后,市值位居芯片行業第二。 8月28日,英偉達發布2024財年第二季(2023年4月30日至7月30日)財報,當季實現營收135.07億美元,同比增長101%,環比增長88%;凈利潤錄得61.88億美元,同比增長843%,環比增長203%,創歷史紀錄。 風口起舞的英偉達,何以成為新時代的科技寡頭?有志于國產替代的企業,如何借鑒其成長經驗? 01、業績、市值均創歷史新高, 還有8年10倍成長空間 英偉達的營收主要來自游戲、數據中心、專業可視化、代工及其他、自動駕駛五大市場。其中,游戲和數據中心是其營收支柱,二者占總營收的比重已由2014年的50.73%上升至2022年的89.24%,2023年二季度再度升至93.4%。 得益于這兩項業務的強勁增長,2013-2022年,英偉達營收和凈利潤分別增長5.5倍、8.9倍(圖1)。其凈資產收益率(ROE)由9.87%上升至19.8%,2023年二季度更升至29.93%,與A股ROE排第15名的山西汾酒(600809)接近。相比高通、AMD等芯片同行上下起伏的ROE,英偉達ROE長期穩定在20%左右,使之堪稱性能穩定的印鈔機(圖2)。 不得不說的是,2023年二季度,英偉達業績如此爆發式增長,全靠上年同期業績的“襯托”和大模型業務的爆發。 一方面,其2022年同期的業績比較基數低。2021年12月至2022年9月,代表美股半導體行情的費城半導體指數(SOX.GI)下跌40%,游戲市場萎縮和幣圈挖礦業務降溫,導致英偉達游戲業務營收驟降44%,專業可視化業務營收下降20%,代工和其他業務營收下降11%,其錄得近10年來第二差的季度業績,僅次于2019年二季度。 另一方面,芯片行業整體陷入蕭條的背景下,2022年11月末,美國科技公司OpenAI推出的ChatGPT爆火出圈,科技公司紛紛跟風推出大模型,帶動作為算力“剛需”的英偉達高性能GPU芯片A100和H100等供不應求、價格飆漲,英偉達業績由此實現連續3個季度增長。 AI暖風勁吹,英偉達股價昂揚向上,2022年10月末至2023年6月13日,由112美元/股飆漲至400美元/股。其也因此首次躋身“萬億美元市值俱樂部”。2023年8月31日,其股價漲至494美元/股高點,市值創歷史新高,達1.2萬億美元,是美股“萬億俱樂部”中2023年股價漲幅最大的“當紅炸子雞”。 近5個財年(2018.1.28-2023.1.29),英偉達累計總股東回報達2.38倍,遠高于標準普爾500指數、納斯達克100指數的回報(圖3)。 英偉達市值飆漲背后,是投資機構真金白銀的下注。 Wind數據顯示,截至2023年6月30日,英偉達機構股東數達3178家,持股市值5956億美元,較2022年12月31日的2338家增長36%,持股市值翻了1.7倍——而這僅是投資機構半年的回報率。其大股東貝萊德(BlackRock)和先鋒集團(Vanguard)均持股超過10年,合計持股從2017年末的11.31%增至2022年末的15.55%。大資金持股的時長,與其投資回報正相關。 值得一提的是,英偉達業績和股價雙升,是全球計算轉型的時代注腳。 算力世界正在從程序慢、成本高的通用計算,向加速計算過渡。正如英偉達創始人兼CEO黃仁勛所說,正在發生的計算轉型是一個轉折點,世界各地的數據中心正在對此做出反應和轉變。這一變革中,企業提高數據吞吐量、能源效率和成本效率的最佳方式是投資加速計算和生成式AI(Artificial Intelligence Generated Content,簡稱“AIGC”)。據麥肯錫的研究,AIGC每年對全球經濟的貢獻將達7.9萬億美元。由此可以預見,遍及全球的算力轉型需求,將為高性能AI芯片帶來廣闊成長空間。 公開數據顯示,2020-2022年,全球GPU的市場規模分別為254.1億美元、334.7億美元、448.3億美元,年復合增長率為32.8%。按照這一增速保守估算,2030年全球GPU市場規模將達到4337億美元,8年有近10倍的成長空間。如果疊加2023年爆發的大模型和AIGC的強勁推動,市場空間將更大。 在二季度財報發布后的電話會議上,黃仁勛也提到:“目前全世界數據中心的價值高達1萬億美元,其中絕大部分使用的是CPU處理器。如果未來4到5年順應AIGC大趨勢,大部分數據中心改用GPU,這會是多么大的市場?” 英偉達顯然對獵獲這個增長紅利野心勃勃。 為了成為算力王者,向智能駕駛、智能云服務、大模型、加速計算等領域的掘金者“賣鏟”,英偉達正致力于成為軟硬一體化的AI算力解決方案供應商:在硬件端,其建構了“GPU+CPU+DPU”的全棧布局;而其開發的運算平臺CUDA(Compute Unified Device Architecture,一種并行計算架構),則被認為是最適合深度學習和AI訓練的架構,開源、可編程性能夠鏈接廣闊的軟件市場,并與通信服務提供商和數據中心建設者合力規劃下一代AI世界的基礎設施。 02、軟硬件一體化, 獨占GPU市場超80%份額 當企業巨頭用科技魔力重塑我們的生活時,那些性格色彩鮮明的商業大佬們,也在虛擬世界緊握著流量密碼。 英偉達的創始人兼CEO是被粉絲們稱為“華人之光”的黃仁勛。這位美籍華人在社交平臺擁有不輸明星的熱度和擁躉,其焊在身上的皮衣與英偉達的GPU產品一樣出圈。 1993年,30歲的皮衣刀客與另兩位合伙人克里斯(Chris Malachowsky)和普雷艾姆(Curtis Priem)創立英偉達。公司名稱“NVIDIA”取自拉丁文,意為嫉妒,公司標識也用了嫉妒的綠眼睛。2023年,步入而立之年的英偉達確實成為了令人嫉妒的公司,連采購其GPU的大客戶特斯拉(TSLA.O)的CEO馬斯克也不無嫉妒地說了一句,“似乎每個人、每條狗都在購買GPU……獲得GPU比獲得毒品還難”。 英偉達早期以生產為游戲PC(個人電腦)提供渲染特效的圖形處理器(GPU或顯卡)為主。其以超越同行的性價比獲得了全球游戲廠商的大批訂單,1998年營收首次突破1億美元,達1.58億美元。1999年,其推出全球第一款可編程顯卡GeForce 256,當年營收同比增長137%,達到3.75億美元。 1999年1月22日,成立約6年的英偉達在納斯達克掛牌上市,開啟了20多年的高速增長。 2003-2022年,英偉達營業收入由18.23億美元增至269.74億美元,凈利潤由0.74億美元增至43.68億美元,分別增長了14倍、58倍。 這20年中,英偉達精準踩中了科技發展的五個大風口:2005年的PC普及、2010年移動互聯網、2016年的深度學習、2021年的幣圈“挖礦”以及2022年的AI大模型,其凈利潤均出現了非線性暴增(圖4)。 我們簡單將其20年的發展劃分為兩個階段,2013年之前為搭建業務架構的蓄力階段,2013年至今為伴隨AI迎風發展階段。 搭建一體化業務架構,英偉達和AMD雙寡頭格局成型 第一階段中,2005年PC銷量爆發和2006年CUDA研發面世,是英偉達搭建業務底座的兩個關鍵節點,前者奠定其產品搭載規模,后者為其打開通向軟件市場之門。 2005年,從工業設計、工業造型,到電影、高清廣播、醫學成像,數字革命幾乎席卷所有行業,全球PC銷量達到2.185億臺,操作系統供應商微軟2005財年凈利潤同比大增50%,2006財年營收突破400億美元,并以超過2600億美元的市值成為全球市值TOP10企業中唯一的科技企業。而搭乘微軟東風的DirectX 9.0 GPU,在圖形處理器市場獨領風騷。 DirectX 9.0 GPU是英偉達可編程GPU與微軟DirectX 9.0高級著色語言的組合產品,能夠高效處理和編輯高清數字視頻、數字照片的圖像,使計算機圖形達到電影級視效。 英偉達與微軟的合作最早在2000年3月,英偉達成為微軟第一款家用電視游戲機Xbox的獨家圖形引擎供應商。當年6月,英偉達即被《商業周刊》評為全球第一的半導體公司;11月,其以7000萬美元現金加100萬股股票收購競爭對手“3Dfx”的圖形處理器核心資產,成為圖形處理器行業規模第一的公司。 2001-2003財年,英偉達營收由7.35億美元增至19.1億美元,年復合增長率達61%。突飛猛進的業績讓英偉達初嘗游戲產品的甜頭,自此,其錨定了以GPU硬件為核心主線的業務發展路徑。 2004年,英偉達GeForce 6800和6600 GPU量產,推動其DirectX 9.0 GPU在兼容圖形處理器領域的市場份額從21%上升至67%。2005年,趁熱打鐵的英偉達進一步擴展其架構和技術優勢,當年6月發布的GeForce 7800將其市場份額從67%進一步拉升到79%,成為GPU市場的第一大供應商。此時,英偉達已將客戶需求融入產品DNA,其GPU隨著微軟操作系統迭代升級而快速升級。 配合客戶需求而發展的GeForce系列,成為英偉達最長青的產品系列之一。其2023年推出的最新產品GeForce RTX 4090,單價12999元起。 值得一提的,上世紀90年代,硅谷誕生了一批專研圖形處理器的公司,它們大多淹沒在技術迭代的洪流中,而英偉達能夠穿越周期,成長為全球GPU龍頭,另一個重要的基石是從硬件向更廣闊的軟件市場延伸,最重要的工具是CUDA。CUDA之于英偉達,類似安卓系統之于谷歌。 2003年,斯坦福大學博士生伊恩·巴克(Ian Buck,現任英偉達加速計算總經理)進入英偉達實習,其所在團隊為解決微軟創建的應用程序接口DirectX的編程門檻過高問題,推出了編程模型Brook。2006年,伊恩·巴克正式加入英偉達,并基于Brook模型研發出CUDA,利用GPU中的并行計算引擎來解決復雜的計算問題,可以加快密集型應用程序的計算速度,比單獨使用一個CPU的速度更快。 2007年開始,英偉達將CUDA內置入其所有GPU產品中。CUDA以彼時最廣泛使用的C語言為基礎,不同客戶的程序員可以根據具體需求和處理任務,對GPU進行相應編程,這一應用很快在程序員群體中流行,具備了成為通用計算工具的能力。這一能力,磨刀霍霍切分CPU廠商的蛋糕,引來了CPU巨頭的聯合圍剿。 2006年,從英偉達采購90% GPU的AMD,以54億美元對價收購GPU供應商ATI,形成CPU整合GPU的新型解決方案。2007年,英特爾收購物理加速引擎公司Havok,并發布CPU融合GPU的Larrabee架構,欲在其CPU中集成GPU。 CPU大廠絞殺疊加經濟危機影響,2008年9月,業績承壓的英偉達宣布裁員6.5%。同年11月,英偉達發布的2009財年三季度財報顯示,其營收下降20%,凈利潤下降74%至0.6億美元,回到了2000年的水平。2008年和2009年,成為英偉達上市以來唯二的虧損年度。利空催化下,其股價一年內蒸發了85%。 業績和市值雙殺,成為黃仁勛創業生涯中一次刻骨銘心的失敗記憶。 試圖提振業績的英偉達,抓住了移動互聯網發端的“救命稻草”。2010年,英偉達開辟移動市場業務,推出費米架構(Fermi)和基于該架構的新一代Quadro GPU,其3D應用性能比上一代Quadro產品快5倍,計算模擬性能比上一代產品快8倍。這助推其專業解決方案(PSB)業務和消費者產品(CPB)業務營收分別實現60%、27%的增長。但是,隨著競爭對手大量涌入,英偉達決定放棄移動市場,回歸并聚焦PC端產品。 這次取舍對于英偉達發展的重要性不言而喻,正如黃仁勛在2023年臺灣大學畢業典禮演講中所言,“戰略性撤退、犧牲、決定放棄什么才是成功的核心,并且非常關鍵”。 值得一提的是,業績低迷期間,英偉達并未停下技術升級的腳步,3年投入26億美元進行研發,以優化晶體管層的設計來解決散熱壓力帶來的產品良率困擾,從而大幅提升產品性能和功耗比。 或許正是英偉達GPU和架構的快速迭代形成的壓力,2009年末,英特爾宣布無限期推遲Larrabee架構發行,并于2011年1月再度與英偉達簽訂6年的專利交叉許可協議。伴隨英特爾的退出,GPU領域英偉達和AMD的雙寡頭競爭格局成型,且持續至今。 超前設計的CUDA架構,與市場的生化反應延遲到了2010年才發生。這一年,AI先驅吳恩達使用AI程序識別出一只貓,使用了16000個CPU處理器,但是將CPU換成GPU,只需要12個GPU。2012年的ImageNet大賽(大規模視覺識別挑戰賽)上,卷積神經網絡模型AlexNet以超出第二名10%以上的正確率獲得冠軍,其利用英偉達GPU的計算能力解決了復雜的模型問題。自此,英偉達GPU被認為適用深度學習,被AI企業大量采購。 至此,GPU和CUDA已成為英偉達故事中關鍵的“1”,此后,其發展主線聚焦于縱向技術迭代和橫向應用拓展,不斷在后面疊加“0”。 縱向技術升級,得益于關鍵技術的引進。例如,2016年,英偉達引入Tensor Core & NVLink高速互聯技術,以多個GPU組建為GPU陣列,進而形成超級GPU,為超強算力奠定了硬件基礎;2022年,其引入NVSwitch交換互聯技術,大幅降低了GPU通訊的延遲,提升了AI大模型高速并行計算中數據同步的效率,為其GPU在深度學習領域建立了強大的競爭壁壘。 這些關鍵性的技術突破,讓英偉達的芯片可以不斷拓展出大規模的芯片集群,進而搭建出任意形式的芯片拓撲結構。2022年末,英偉達GPU顯卡中的CUDA Core(核心)數量已較2007年提升超30倍,其GPU搭載于世界上最快的超級計算機。 橫向應用擴展方面,英偉達逐漸衍生出“GPU+CPU+DPU”的全棧布局,先后開發出Kelvin、Rankine、Curie、Tesla、Fermi、Kepler、Maxwell、Volta、Turing、Ampere、Hopper等不斷升級的架構,并在這些架構基礎上推出十多個產品系列(表1),支持從圖像處理到并行計算再到AI數據處理等不同應用場景,英偉達的產品已成為GPU芯片專業性能和兼容性的基準。 數據中心替代游戲成最大營收支柱,凈資產收益率穩定在20%左右 英偉達的營收中,游戲和數據中心是核心支柱,二者占營收的比重由2014年的50.73%升至2023年二季度的93.4%(表2)。 這一變化來自游戲市場和AI產業對GPU日益膨脹的需求,而市場風口的切換,直觀體現在英偉達營收支柱的切換(圖5)。 2021年前,游戲業務是英偉達絕對的營收支柱。2014-2021年,其游戲產品營收由20.58億美元增至124.62億美元,年復合增長率達30%。 近20年來,全球3A/3D游戲不斷推新,催生了對GPU處理器的巨大需求。全球億萬玩家倒逼高性能3D圖形渲染成為PC制造商重要的差異化賣點,而GPU是PC實現這一差異化的關鍵部件,因此,PC代工廠商進一步倒逼英偉達的GPU在滿足終端用戶、程序開發商和設備制造廠商三方需求中不斷尋求平衡。 從早期的《生化危機》《全面戰爭》《榮譽勛章》到后來的《魔獸世界》《英雄聯盟》《王者榮耀》等網絡游戲,均擁有超長的生命周期,它們背后億萬付費玩家在全球培育出動視暴雪(ATVI.O,2022年1月被微軟以687億美元對價收購,2023年10月下旬完成交易)、騰訊、網易等多家市值超5000億元的公司。 2022年,全球游戲市場營收約為1844億美元,網絡游戲市場營收為1326億美元,占比達72%。其中,中國是網絡游戲最大市場,貢獻了全球收入的20.1%。2003-2021年,游戲市場規模急劇擴張,中國游戲市場規模由13.2億元增長至2965.13億元,18年擴大224倍。 面對如此擴容的市場,主要面對PC端用戶的英偉達開發出四類產品,包括用于臺式機和筆記本電腦游戲的GeForce RTX和GeForce GTX GPU、用于低功耗設備上玩PC游戲的GeForce NOW、用于電視上播放高質量流媒體的SHIELD,以及適用于游戲主機的片上系統(SOC)和開發服務。 不玩網絡游戲的人很難體會顯卡配置的重要性,但通過間隔一年的兩代產品,可以看出英偉達顯卡的迭代效率。 2022年9月,英偉達發布了Ada Lovelace GPU架構,并推出了基于該架構的首批產品,包括GeForce RTX 4090、RTX 4080和RTX 4070。其中,RTX 4090內置760億個晶體管、16384個CUDA核心和24GB高速鎂光GDDR6X顯存,在4K分辨率的游戲中持續運行速度超過100FPS,光線追蹤技術帶來的纖毫畢現得以完美實現。而其于2020年9月發布的GeForce RTX 3090產品,內置283億個晶體管、10496個CUDA核心和24GB GDDR6X顯存。 4090較3090性能提升2-4倍,但功耗同樣保持在450W。保持同等能耗的基礎上大幅提升產品性能,對于芯片公司是翻山越嶺的難度。 即便產品性能提升不止,2021年后,英偉達游戲業務營收仍掉頭直下。英偉達在其年報中的解釋是,“全球宏觀經濟狀況及中國游戲需求下降的影響”。 被英偉達特別強調的中國市場(不包含臺灣地區),多年來一直是其銷售額最高的市場之一,但近年銷售額明顯下降,由2021年的71.11億美元下降至2022年的57.85億美元,占英偉達總營收的比重由2021年的26.42%下降至2023年上半年的20.92%(圖6、7),中國市場的重要性可見一斑。 接替游戲成為英偉達創收支柱的,是數據中心。2023年上半年,這一業務的營收達到146.07億美元,接近2022年全年150.05億美元的水平,直線拉升了英偉達的業績。 數據中心的營收不是突然暴增。2014-2022年,英偉達數據中心的營收年復合增長率達62%。同期,英特爾的數據中心營收由143.87億美元增至191.96億美元,年復合增長率為3.7%。兩家公司數據中心的業務雖然不同,但英偉達增速之快,可見一斑。 數據中心業務是什么? 根據英偉達財報中的闡述,我們可以將其簡單理解為算力平臺或者算力服務。 英偉達算力平臺,由英偉達的高能效GPU、數據處理單元(DPU)、互連和系統、CUDA編程模型,以及越來越多的軟件庫、軟件開發工具包(SDK)、應用框架和服務組成,服務于大多數加速計算密集型的工作負載,如AI、數據分析、圖形和科學計算、超大規模云和企業、公共部門和邊緣數據中心等。該平臺既可以作為整體系統打包出售,也可以單獨出售,以應對客戶的定制化需求。 英偉達的GPU和相關軟件的大規模并行計算架構非常適合深度學習、機器學習和高性能計算,為AI時代的規?;嬎闾峁﹦恿?。加速計算的能力,令英偉達得以借力三個應用風口,成就AI時代的高速發展。 第一個風口,2016年深度學習接管互聯網。2015年的英偉達GPU技術大會上(GTC大會),黃仁勛宣布英偉達全面轉型AI。2016年3月,谷歌的機器人阿爾法狗(AlphaGo)擊敗了圍棋世界冠軍、職業九段棋手李世石,引發全球關注深度學習。隨后,谷歌、微軟等互聯網巨頭快速將各自的深度學習平臺開源,供全球開發者無壁壘使用,向企業提供傳統編碼無法提供的云和AI服務,大量數據反哺深度學習,加速了AI的進化。英偉達推出NVIDIA TensorRT深度學習推理框架和Inception計劃,以支持深度學習和數據科學領域的初創企業發展,這帶動其2016年GPU業務營收同比增長39%。 第二個風口,2021年加密貨幣“挖礦”產業回春。英偉達推出了Lite Hash Rate(LHR)和GeForce GPU,并增加了CMP(cryptocurrency mining processors,加密貨幣處理器)的供應,以滿足“挖礦”大規模計算的需求。2021年一季度,CMP為英偉達創收1.55億美元,上半年創收4.21億美元,部分對沖了游戲市場下滑對其業績的負面影響。 第三個風口,2022年11月,語言大模型催化AI時代提前到來。這一年11月30日,OpenAI推出ChatGPT,5天內注冊用戶數超過100萬,兩個月后月活用戶超過1億,成為史上增長最快應用,全球掀起語言大模型和AIGC研發潮。中國市場以華為盤古、百度文心、騰訊混元、阿里通義為代表的大模型如雨后春筍般涌現,對高性能芯片的需求井噴。 AI大模型是“大數據、大算力、強算法”結合的產物,其中,大算力堪稱基礎設施。英偉達基于Hopper和Ampere架構推出的A100、H100以及特供中國市場的A800和H800(A100和H100部分性能減配的替代產品)等高性能芯片,是AI大模型的核心部件。 大模型潮起,英偉達“A+H”系列芯片銷量激增。2023年8月10日,多家媒體報道,百度、騰訊、阿里等中國企業向英偉達采購約10萬顆A800、H800處理器,訂單總額或超50億美元。 AMD的CEO蘇姿豐(Lisa Su)曾提出,2023年,全球數據中心AI加速器的潛在市場總額將達到300億美元左右,預計到2027年,這一數字將超過1500億美元(折合1.095萬億元),年復合增長率超過50%。這意味著,英偉達數據中心未來營收的增長空間巨大。 除了硬件支持,英偉達也提供大模型服務,推出語言模型NVIDIA NeMo、圖像視頻模型NVIDIA Picasso、藥物研發模型NVIDIA BioNeMo等全棧式服務,用戶可自定義用例并調整模型。 值得一提的是,除了中國科技圈興起“百模大戰”,業務與AI毫不沾邊的上市公司也在采購高算力芯片處理器,以圖跨界“算力”提振股價。 2023年9月29日,蓮花健康(600186)公告,其全資子公司杭州蓮花科技創新有限公司將以6.93億元的總價,向新華三集團控股子公司新華三信息技術有限公司采購330臺英偉達H800 GPU系列算力服務器(每臺服務器含8張GPU)。在此之前的一個月內,蓮花健康股價由3.22元/股上漲至5.98元/股,大漲86%,創5年來新高?!八懔Α备拍顚股公司市值的提振效力,可見一斑。 馬太效應下,越來越多不同行業的企業和初創企業使用英偉達的GPU和軟件,將其構建的產品和服務實現自動化。例如,專業設計師使用其GPU和軟件創建電影中的視覺效果,并設計從手機到商用飛機的建筑物和產品;交通運輸行業用其構建自動駕駛平臺;醫療保健行業用以增強醫學成像和加速藥物發現;金融服務行業借此進行欺詐檢測。 英偉達成為二季度全球業績增長最強勁的科技公司背后,是其在顯卡領域遙遙領先的市場份額。公開數據顯示,英偉達占據全球數據中心AI加速市場82%的份額,而且,以95%的市場占有率壟斷了全球Al訓練市場。 近乎“壟斷”的市場地位,簡單總結源于英偉達三方面的優勢。 一是產品和架構?;诩軜嫷撵`活性、多功能性和穩定高速性能,英偉達能夠勝任從數據處理到訓練、推理,推理前對數據所進行的預處理,再到后期的數據處理,語言進行標識化以便用于訓練等任務。尤其是大模型和AIGC的工作流程強度大,大量的應用程序需要強大的并行處理能力,英偉達的架構組合和產品能夠加速中心計算程序,以保證最低的運算和保有成本。 二是規模和速度。在游戲、智能駕駛、大模型、加速計算、智能云等終端上,英偉達已擁有龐大的安裝量。龐大的規模和超快速度,決定了英偉達能夠在不同的使用模型和計算環境中,持續發展極其復雜的軟硬件、網絡和計算堆棧,在保質保量的前提下加快客戶的工程進度。而軟件開發者能夠通過英偉達的平臺,接觸最大數量的終端用戶,提升業務或獲得投資回報。規模效應下,在行業未出現大的技術創新和拐點前提下,強者愈強的馬太效應將不斷鞏固英偉達的領先優勢。 三是系統和生態。在AI大模型訓練等并行工作負載中,性能強大的芯片處理器重要,軟件生態更重要。性能強大的GPU讓英偉達成為芯片巨頭,但使英偉達成為全棧計算平臺的,是其龐大的軟件體系。 英偉達除了提供CUDA并行編程模型、CUDA-X應用加速庫、應用程序編程接口(API)、SDK和工具以及特定領域的應用程序框架,還提供NVIDIA GPU Cloud注冊表(NGC),這是一個涵蓋科學計算、深度學習和機器學習等領域、易于使用且經過優化的軟件堆棧的全面目錄。借助NGC,AI開發人員、研究人員和數據科學家可以開發AI和HPC(高性能計算)應用。 基于英偉達構建的軟件系統,其硬件可以在每個大型計算機制造商和大型云服務器(CSP)的行業標準服務器中使用,也可以在英偉達DGX AI超級計算機中使用(DGX是一個專門為深度學習和GPU加速應用而構建的系統)。為了擴大可用客戶群體、降低使用門檻,英偉達圍繞GPU構建了多種現成系統,包括面向超大規模和超級計算數據中心的HGX、面向企業和邊緣計算的EGX、面向高精度邊緣人工智能的IGX以及面向自主機器的Argan。 算力王者背后,是英偉達從產品到平臺再到生態系統不斷進化,并擴大其領先優勢。那么,英偉達這樣的優勢能否輕易復制呢? 03、370億美元投入研發, 專業化收購完善技術鏈 風口即市場需求,連續踩中科技產業發展風口,背后是英偉達滿足爆發性算力需求的能力。 這一能力,源自其對變化中的早期市場和初創公司的關注和長期布局。例如,在ChatGPT爆紅出圈之前的2016年,黃仁勛已拜訪創立于2015年12月的OpenAI,并捐贈搭載8顆P100價值百萬的超級計算機DGX-1,成為“為ChatGPT算力助攻的英偉達”。 插播一句,OpenAI采用了與AI先行者谷歌不同的技術路線,谷歌2017年6月推出具有6500萬個可調用參數的Transformer模型,而OpenAI采用GPT(生成式預訓練)模型,并于2018年推出具有1.17億個參數的GPT-1。二者之間的技術競賽自此開啟。 我們從其產品迭代的時間密集度上,感受一下OpenAI進化的速度:2019年2月15億參數的GPT-2、2020年5月1750億參數的GPT-3、2021年1月120億參數的DALL-E、2021年6月120億參數的Codex、2022年3月13億參數的InstructGPT、2022年11月末20億參數的ChatGPT相繼推出。 OpenAI每一次進化,都伴隨著谷歌的迭代回應。2021年5月,谷歌發布1370億參數的AI系統LaMDA對話應用語言模型。正是巨頭之間你追我趕的競爭,才推動了全面AI時代的提前到來。 堪稱初創公司算力最強助攻的英偉達,全球超過30000家合作伙伴中,15000家是初創公司,其中包括數千家AIGC公司。截至2023年1月末,英偉達GPU支持的應用程序已超過2800個。英偉達為全球TOP500排行榜上超過70%的超級計算機提供支持,其中包括Green500排行榜上排名前30的系統中的23個。正如三六零(601360)創始人、董事長周鴻祎評價英偉達,“對用戶真正產生價值,才能慢慢生出偉大”。 如前所述,從賣GPU顯卡,到賣平臺服務,再到構建軟硬一體的AI算力生態系統,推動英偉達演進的核心動能來自研發與收購。 “Innovation is at our core”(創新是我們的核心)是英偉達每一年的年報中均會出現的固定表達。研發是科技公司的第一生產力,截至2023年1月末,英偉達研發方面的投入累計超過370億美元,擁有19532名研發人員,占員工總數的75%。 其中,2013-2022年,其研發支出的絕對值保持著高速增長,研發占營收的比重穩定維持在20%(圖8)。與同類可比上市公司相比,英偉達研發投入占營收的比重達23.47%,高于高通和AMD(表3)。 除了真金白銀做研發,從內部構筑技術發展動能,英偉達也以收購從外部完善技術鏈。 科技行業是并購重組的主陣地,英偉達30年的發展歷程中,并購時有發生。從2000年收購圖形芯片廠商3dfx,到2023年計劃收購移動芯片供應商ARM,英偉達借助收購來實現技術躍升、業務拓展,從而實現業務轉型和產業鏈完整。 我們從代表性的案例,來看資產收購對英偉達的意義。 第一,2019年3月至2020年4月,英偉達以70億美元的對價收購以色列芯片制造商邁絡思科技有限公司(Mellanox Technologies,簡稱“Mellanox”)。該公司是全球領先的服務器和存儲端到端連接解決方案的供應商,產品包括以太網交換機、InfiniBand智能互連解決方案、服務器、存儲設備和超融合基礎設施,應用于高性能計算、云計算、數據中心、企業計算及存儲市場,全球500強超級計算機中超過一半使用其設備。 借此收購,英偉達硬件產品布局得以從GPU擴展至DPU。英偉達推出了BlueField DPU,由數據中心基礎架構軟件DOCA提供支持,通過DOCA,開發人員可以為BlueField DPU構建軟件定義、硬件加速的網絡、安全、存儲和管理等應用程序。因此,英偉達可以在整個計算、網絡和存儲堆棧中進行優化,以提供數據中心規模的計算解決方案。目前,BlueField DPU應用于頂級的安全、存儲和網絡公司,但滲透率還比較低。 黃仁勛在2022財年第一季度財報發布時表示:“Mellanox收購完成一年來,超出了我們的預期,英偉達也轉型為一家數據中心級計算公司?!?/p> 第二,2022年1月10日,英偉達收購其十多年的合作伙伴Bright Computing。該公司成立于2009年,是全球領先的高性能計算軟件開發商,其所生產的軟件管理著全球700多個組織使用的高性能計算系統。 借此收購,英偉達強化了其軟件在邊緣計算、數據中心和公有云、混合云等領域的運作能力,從而進一步擴大其高性能計算市場。截至2023年1月末,全球25個高性能計算應用程序中的23個使用英偉達的產品。 第三,2022年3月,英偉達收購其合作伙伴Excelero。該公司成立于2014年,是一家高性能軟件定義存儲供應商,其開發的NVMesh軟件,可管理和保護NVMe閃存驅動器的虛擬陣列,作為跨公有云和私有云的塊存儲,其塊存儲在運行DPU的DOCA軟件框架中發揮重要作用。被收購后,Excelero的技術被集成到英偉達的軟件堆棧中,并應用到AI和高性能計算平臺。 第四,2023年7月,英偉達收購了AI初創公司OmniML。該公司成立于2021年的美國加州,主要產品是一個旨在快速、輕松地大規模進行AI優化的平臺Omnimizer,其軟件可以壓縮機器學習模型的大小,以便在更小的設備上驅動人工智能,但其引用的示例主要涉及計算機視覺。例如,幫助智能攝像頭或自動駕駛汽車識別周圍的物體,是汽車實現自動駕駛的關鍵技術之一。 值得一提的是,OmniML的三位聯合創始人本科均畢業于清華大學,分別是麻省理工學院電氣工程和計算機科學教授韓松、Meta前軟件工程師吳迪,以及參與發明深度壓縮技術的毛慧子。 除了上述“強鏈補鏈”式收購,英偉達也曾啟動收購移動芯片巨頭,借以重回移動領域。 籌劃收購ARM(ARM.O),是英偉達歷史上最受矚目的收購計劃。 ARM是一家移動端CPU芯片和架構供應商,全球99%的智能手機和89%的平板電腦使用其芯片架構,其成立至2022年末,芯片出貨量超過2500億顆。一直面向PC客戶端的英偉達,如果收購ARM,將實現其在移動端的業務突破,覆蓋PC和移動端客戶,成為芯片領域真正的“壟斷者”。 收購的機會由ARM控股股東軟銀釋放。2020年9月14日,因多筆投資價值大縮水而在2019財年出現成立15年來首次虧損(虧損130億美元)的軟銀,為緩解財務壓力,宣布將ARM以400億美元對價出售給英偉達。但這一交易計劃自帶的“壟斷”屬性,很快遭到ARM公司創始人赫曼·豪瑟(Hermann Hauser)和英國、歐洲、美國和中國的監管機構以及高通、微軟、谷歌等公司的反對。2023年2月9日,英偉達正式宣布放棄該項收購,軟銀轉而推動ARM獨立上市。2023年9月14日,ARM在納斯達克上市,創下2023年全球最大規模IPO紀錄。ARM最新市值為515億美元。 長期堅守內部研發和外部收購,造就了如今擁有算力生態系統的英偉達。那么,需要提問的是,英偉達有哪些“軟肋”限制其未來發展呢? 04、輕資產代工生產模式, 兩大環節“卡脖子” AI風口上,GPU是一個賣方市場。 大模型訓練的“入門級”算力支撐,至少需要1000顆A100芯片。GPT-3模型訓練采用的超級計算機,則需搭載數萬顆英偉達A100芯片,而升級后的大模型需要的芯片更多。因此,創建大模型的第一門檻,就是芯片的數量和芯片價格。 供不應求下,2022年12月至2023年6月的半年內,英偉達A100價格累計漲幅近70%。英偉達H100的單價在2023年8月末超過了4.5萬美元,專業機構推算,其成本約3000美元,利潤率達1400%。 這樣的暴利產品,當然大賣特賣最好,讓利潤漲到天上去。但是,高端芯片的生產工藝復雜度和產品良率幾乎成反比,英偉達“生產”不出來市場所需的芯片。站在產業鏈頂端的科技巨頭,正在遭遇“卡脖子”。 芯片行業如同所有高端制造業,有重資產一體化模式,也有輕資產的代工模式,前者的代表如英特爾(僅20%的產品由外部代工),后者代表如英偉達,雖然二者的產品結構不同,但隨著高端產品占比提高以及出品規模增長,2020年開始,英偉達的凈利率超過了英特爾,2023年上半年,差距進一步拉大(圖9)。 作為一家專注芯片設計和銷售的公司,英偉達生產上依靠臺積電等供應商,其芯片產品升級迭代中,生產環節的復雜度和生產工藝的難度往往呈非線性增長,需要整個供應鏈的合力支持,甚至面臨供應鏈的重構(表4)。 這就導致,在外包生產的輕資產模式中,如果代工廠遭遇生產效率低下或排產限制等問題,產品就會無法按期量產或交付延期。早在2012年,英偉達即出現過產品因代工廠原因而供不應求的問題。2012年一季度,由于臺積電28納米開普勒(Kepler)GPU容量限制,英偉達無法滿足客戶對高端臺式機GPU產品的需求,導致當季營收下降4%,凈利潤下降55.3%,一直持續到2013年一季度才重回正增長軌道。 截至2023年1月,對臺積電營收貢獻排名前10的客戶分別是蘋果、聯發科、AMD、高通、博通、英偉達、Marvel、意法半導體、亞德諾、英特爾。2020-2022年,其來自最大單一客戶蘋果的銷售金額由3367.76億元新臺幣增至5296.5億元新臺幣,增長57%,但蘋果占臺積電總營收的比重由25%降至23%。由此可見,臺積電的客戶集中度在下降,單一大客戶很難對其業績構成特別重大影響。 針對客戶對臺積電的產能占有問題,臺積電在2023年財報中明確表示,由于設計技術和功能的快速變化,代工客戶一般不會提前很多時間下采購訂單來制造產品,但是一部分客戶與其達成協議,通過支付臨時費用以獲得臺積電晶圓廠的指定產能。 這意味著,臺積電的排產計劃中,預留了臨時付費增產的空間。據悉,臺積電正以超級急件(superhotrun)生產英偉達GPU,但H100和A100的訂單已經排到2024年二季度,即現在下訂單,明年年中才能收貨。 一般而言,芯片的性能與晶體管的數量正相關,但單位面積的硅片上晶體管排布越多,能耗越大散熱問題越突出,產品良率也越低,因此芯片設計的關鍵在于性能與能耗必須達成平衡。 以服務于超級加速器的芯片H100為例,其是由超過3.5萬個零件和近1萬億個晶體管組成的系統組件,內部設計的復雜程度,外行難以想象。 拆分芯片結構,H100主要由邏輯芯片、HBM存儲芯片、CoWoS封裝、PCB板等輔助器件組成。目前,封裝和存儲芯片是兩大“卡脖子”環節。 我們以H100最通用的版本H100 SXM為例,其采用的是臺積電CoWoS的7晶粒封裝,存儲芯片則是6顆16G的HBM3芯片分列兩排、圍繞中間的邏輯芯片。 首先,臺積電CoWoS封裝是一種2.5D封裝工藝,能將計算、內存等晶片堆疊到硅中介層或硅轉接板,通過硅中介層上的高密度布線,實現晶片互連,再安裝到基板上進行封裝。這提升了芯片的連接速度、降低了功耗,相較直接在芯片上打孔、布線的3D封裝工藝,其成本更低、散熱更優,數據吞吐帶寬更寬,幾乎是市場上高算力、高存儲芯片的唯一封裝工藝。 目前,英偉達、AMD的4款高性能GPU均采用這一封裝工藝。但臺積電該封裝工藝產能不足,且目前幾無可替代廠商,這限制了英偉達相關產品的產量,預計2024年,三星或可提供該封裝服務。 按照集邦咨詢預測,臺積電正在擴產能,其CoWoS月產能將在2023年底達到1.2萬片,即便是臺積電把CoWoS產能都排給英偉達,英偉達高端芯片產能的天花板也僅是1.2萬片/月。因此,解決了封裝環節的限制,高端芯片的出貨量才會增加。 其次,存儲芯片供應不足。H100中的6顆HBM3存儲芯片,由韓國SK海力士獨家供應。一張H100 SXM使用6顆HBM3存儲芯片的成本約1500美元。2023年上半年,三星的HBM3量產出貨加快,存儲芯片在2023年下半年后或不再限制H100出貨量。 一塊H100重達70磅,這幾乎是今年市場上唯一用“體重”計量的芯片產品,其2023年二季度出貨量超過了900噸。從長期來看,H100的供需缺口會隨著AIGC的應用爆發而水漲船高。根據金融時報的報道,2024年H100的出貨量預計將高達150萬-200萬張,相比于2023年的50萬張提升3-4倍。有華爾街投行預測,2024年英偉達“A+H”系列顯卡的出貨量合計將達到300萬-500萬張。 得益于H100等高性能產品的拉動,2023年二季度,英偉達的毛利率達到68.2%,較2022年末的56.9%提高了11.3個百分點,創歷史新高,且高于直接競爭對手英特爾和AMD(圖10)。英偉達的毛利率,在Wind美股半導體設備與產品分類的104家公司中,排名第10。排名前9的公司中,6家2022年凈利潤錄得虧損,僅博通(AVGO.O)的凈利潤高于英偉達。 令競爭對手不寒而栗的是,H100和A100產能尚在爬坡階段,英偉達性能更強的新產品又來了,一場看不見硝煙的算力戰爭正在發生。 05、黃氏定律挑戰摩爾定律, 算力會鎖死嗎? 順周期航程中,站在頭部的巨頭,只會加速。 2023年8月初,在美國計算機協會計算機圖形圖像特別興趣小組(Special Interest Group for Computer GRAPHICS,簡稱“SIGGRAPH”)組織的2023年年會上,英偉達發布了基于Grace Hopper架構、搭載的存儲器為全球首款HBM3e(較HBM3快50%)處理器的新顯卡GH200,可用于處理大語言模型、推薦系統、矢量數據庫等全球最復雜的AIGC工作負載所需。該芯片配備141GB內存、72核ARM中央處理器和每秒5TB的帶寬,較H100芯片內存增加1.7倍,傳輸頻寬增加1.5倍。 GH200已于2023年5月全面投產,基于GH200 Grace Hopper平臺的新系統將于2024年第二季度開始交付。 對于使用者來說,投資800萬美元使用Grace Hopper,相當于使用8800個價值1億美元的X86 GPU,整體成本降低12倍、能耗降低20倍。這也是黃仁勛說的“買的越多越省”的原因。 需要強調的是,英偉達的新平臺依舊延續兼容模式,客戶可以通過英偉達NVLink與其他超級芯片連接、協同工作,進而部署大型AIGC模型。因此,英偉達的一致性技術使GPU可以訪問CPU內存,在雙配置中可提供總計1.2TB的快速內存。 這無疑進一步加大了使用者改換GPU和平臺的難度和成本。用戶忠誠度“被動”加固。 那么,英偉達GPU芯片的性能升級會永無止境嗎? 芯片性能提升過程中,晶體管數量增加的規律誕生了一個摩爾定律,即集成電路上可容納的元器件數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。在客觀存在的物理限制下,整個行業間隔十多年便會出現困擾聰明大腦的問題,摩爾定律會不會失效、算力會不會鎖死? 2023年9月29日,英偉達發布的一篇博客稱,在過去10年中,英偉達GPU的AI處理能力增長了1000倍。由此,“單芯片推理性能”中看到的加速不會逐漸消失,理論上會繼續出現,這一發現被業內稱為“黃氏定律”。 短期內算力不會鎖死,但AI大模型最強助攻的英偉達,如果其顯卡所有環節都實現產能自由,那么,根據工業品規?;a的萊特定律,產品累積產量翻倍,單位成本將下降固定百分比。 例如,汽車行業,整車廠產量翻倍,其成本價格就會下降15%。據相關機構測算,在芯片行業中,晶圓產量翻倍,成本下降約22%。如果技術迭代,比如芯片從10納米迭代到7納米技術,交付處理器的最終成本每年可以下降30%-33%。 正如臺積電2023財年年報所示,當其產能利用率增加時,固定制造成本會分攤到更大的產量上,產量越大,單位成本越低。為了提升芯片制造效率,針對當前的SoC開發方法,臺積電開發了多項晶圓加工程序,多個客戶可以共用掩膜(mask芯片制造中的模具),從而降低客戶的原型成本、縮短產品上市周期。 英偉達與臺積電在長期合作中,學習曲線效應與技術難度升級共振,彼此均獲得了不可替代的優勢。這也是AI芯片賽道上,英偉達被英特爾、 AMD、微軟、谷歌等巨頭追趕多年,卻尚未被超越的根本原因,而臺積電也越來越難被替代。 但是,產能受限的英偉達,必然無法獨吞未來10年AI算力芯片的萬億市場蛋糕,哪些公司將會是英偉達強勁的對手呢? 06、算力行業競爭加劇, 英偉達要做“AI界的臺積電” 全球GDP增長乏力的背景下,數字經濟保持強勁增長。發展數字經濟,算力是核心生產力,未來很長一段時間,投資算力將對經濟增長產生倍增效應?!?022-2023年全球計算力指數評估報告》顯示,算力指數平均提高1個百分點,該國的數字經濟和GDP將分別增長 3.6‰和1.7‰。 算力已成為經濟增長的主要驅動力之一,且全球主要國家數字經濟占GDP的比重持續增長。2022-2026年,該比重預計將從50.2%增長到54%。其中,2022年中國AI算力規模達到268百億億次/秒,超過通用算力規模。預計未來5年中國智能算力規模的年復合增長率將達52.3%。 熱門賽道上,從來沒有獨一份的生意,即使是在算力世界“廣積糧高筑墻”的英偉達,也面臨競爭對手的追擊。 競品頻出,AI算力市場風起云涌 目前,英偉達主要的競爭對手有兩類:一是以AMD和英特爾為代表的解決方案供應商和許可方;二是以谷歌、亞馬遜、微軟為代表的大型云服務商。 首先,專業處理器陣營第一梯隊的英特爾和AMD,2023年均已推出對標英偉達H100的產品和對標CUDA的軟件系統。 為應對AI時代的算力需求,2023年7月,英特爾推出面向中國市場的第二代Gaudi深度學習加速器Habana Gaudi 2,用于AI訓練,意在爭奪“百模大戰”的中國市場。 目前,英特爾數據中心有兩大系列產品,Gaudi系列為人工智能加速領域中的專屬產品,適用于大模型的工作負載,Max系列GPU適用于科學計算領域。預計到2025年,英特爾將把兩條產品線融合,推出結合第二代Gaudi的GPU產品。 2023年9月19日,Intel On技術創新大會上,英特爾CEO基辛格(Pat Gelsinger)披露了5nm AI芯片Gaudi 3,該芯片將于2024年推出。同時,基辛格還預覽了第五代英特爾至強可擴展CPU處理器,其較第四代的AI性能提升2-3倍。阿里巴巴的“阿里云通義千問大模型”,使用的即是英特爾第四代至強處理器。 英特爾還宣布與ARM合作推出AI推理和部署運行工具套件OpenVINO,不僅支持預訓練模型,也支持跨平臺應用,以構建其軟件生態。 值得一提的是,早在2021年12月,英特爾已推出了one API,作為其“軟件先行”戰略的重要一步。one API是一個統一簡化的編程模型,旨在簡化跨多架構的開發過程(如CPU、GPU、FPGA、加速器),建立類似英偉達CUDA的軟件橋梁。 2023年9月19日,英特爾的軟件計劃迎來新的跨越,Linux基金會宣布,成立統一加速UXL基金會。這是一個跨行業組織,致力于提供一個開放的標準加速器編程模型,簡化開發高性能、跨平臺應用程序的過程,其核心是加速演進英特爾one API計劃。 該基金會的參與組織包括ARM、富士通、谷歌云、英特爾、高通、三星、Imagination Technologies(2017年被凱橋資本以5.5億英鎊收購)等公司,不包括英偉達。簡單概括,這些芯片公司試圖建立一個更大更開放的生態系統,角力英偉達的生態系統。 GPU二號玩家AMD,2023年6月推出Instinct MI 300A和Instinct MI300X兩款加速顯卡,用于AI和高性能計算等領域。 前者是全球首個為AI和高性能計算打造的APU加速卡,也是AMD首款采用“CPU+GPU+內存”的一體化組合產品,其中包含1460億個晶體管、24個Zen 4 CPU核心、1個CDNA 3圖形引擎和128GB HBM3內存。后者則是對標英偉達H100、面向AIGC推出的加速器,內含1530億個晶體管,單卡可支持400億參數的大模型,其顯存容量和帶寬均超越H100,是AMD產品史上最大的芯片產品,預計將于2023年四季度量產。 除此之外,AMD還推出集合了8個MI 300X的Instinct Platform,對標英偉達CUDA,同樣以軟硬一體化模式提供AI算力解決方案。 其次,向英偉達貢獻萬顆芯片訂單的云商大客戶,也紛紛自研AI芯片。 云服務是能夠將AI三要素(數據、計算和模型)融合的最佳模式。微軟AWS、亞馬遜Azure、谷歌云等大型云服務商,正在自研芯片和AI模型,以降低使用算力與模型服務的成本。 以最早研發AI芯片的谷歌為例,早在2016年,其數據中心已推出TPU,2023年4月推出AI芯片TPU V4,比英偉達A100處理速度快1.2-1.7倍,功耗卻低1.3-1.9倍。更重要的是,谷歌已將AI芯片團隊調整至谷歌云團隊中,以提高谷歌云AI芯片的租用服務能力。 同樣,華為也提出全面智能化戰略,打造中國堅實的算力底座,為世界構建第二選擇。有消息稱,華為的GPU技術能力已可以對標英偉達,其昇騰910芯片性能可對標A100。 而微軟則因為投資了OpenAI而躍升為大贏家,從Bing到Office再到Windows,微軟不斷將OpenAI的技術置入旗下產品,風頭壓過了谷歌。2023年二季度,微軟云全球市場份額達26%。2023財年,微軟云收入同比增長22%至1116億美元。持續增長的微軟云,未來有望超越市場份額30%的亞馬遜云。 作為OpenAI的獨家云供應商,微軟Azure支持OpenAI的所有工作負載。同時,微軟也增加了對專業超級計算機系統的開發和部署的投資,以加速OpenAI的相關研究。 微軟已宣布,對其生產力軟件中的AIGC功能收取30美元/月的費用,云計算與大模型的疊加效應已經為其帶來實實在在的收益。 面對日益高昂的算力費用,微軟也將于2023年11月推出AI芯片“雅典娜(Athena)”,用于其數據中心服務器,并可用于ChatGPT訓練,從而降低微軟內部和OpenAI大模型訓練和推理的成本,減少對英偉達芯片的依賴。 面對科技巨頭的競爭與追趕,英偉達也在延伸服務鏈條,降低其產品的使用門檻和可觸達性。 向云服務延伸,對標臺積電 AI時代,高性能的算力配置價格高昂,大模型訓練成本動輒成千上百萬美元,并不是所有公司都擁有入場資格。 自2020年以來,OpenAI在其最大的支持者微軟建造的大型超級計算機上,開發了AIGC技術,該計算機使用了1萬顆英偉達的GPU?,F在建造這樣一臺超級計算機,僅GPU成本已近20億元。 Bernstein分析師斯泰西·拉斯貢(Stacy Rasgon)分析,運行ChatGPT是非常昂貴的,每次查詢大約花費4美分,如果ChatGPT的搜索量增長到谷歌搜索量的1/10,它將需要大約價值481億美元的GPU,每年需要價值約160億美元的芯片來維持運行。隨著英偉達GPU供不應求、價格飆漲,OpenAI不少短期計劃被迫推遲。有報道顯示,OpenAI正在探索自研AI芯片,并有意收購一家芯片公司,解決被芯片短缺限制進程的障礙。 成本高昂,但每一個企業都需要大模型和AI服務,這是增長潛力巨大的長尾市場。 為此,黃仁勛提出英偉達要做“AI界的臺積電”,通過與大模型廠商、云廠商合作提供高性價比的云服務解決方案,幫助下游企業降低大模型訓練成本。 向云業務延伸的英偉達,推出云服務相關模型的動作迅速,一手合作、一手投資。 2022年8月,英偉達發布原生AI模型Omniverse Avatar Cloud Engine(ACE),任何規模的企業都能夠通過其云端的模型和服務即時獲得創建并部署虛擬助手和數字人所需的大規模算力。 2023年3月,英偉達推出用于自定義AI基礎模型的AIGC云服務BioNeMo,能夠加速新蛋白質和治療方法的創建以及基因組學、化學、生物學和分子動力學等領域的研究。 2023年3月,英偉達宣布推出包括NVIDIA NeMo、NVIDIA Picasso和NVIDIA BioNemo在內的一整套云服務,使企業能夠構建、完善和運行自定義大型語言模型和AIGC模型。 與此同時,英偉達與微軟、谷歌、甲骨文等云計算巨頭合作托管其DGX Cloud,合力提升超大規模云的性能。用戶無需采購和擁有服務器,可以通過瀏覽器訪問DGX Cloud,包括AI超級計算、AI框架、預訓練模型服務,DGX Cloud的收費標準是每個實例36999美元/月起,每個實例包括8個H100或A100 80GB GPU,每個GPU節點內存達640 GB,且計算資源專用,不與云中另外的租戶共享。 除了與大型云服務商合作外,英偉達還密集投資了云服務初創公司。 投資標的之一是“算力黃?!盋oreWeave。成立于2016年的CoreWeave,起初業務單一,就是用算力“挖礦”,其向英偉達采購了大量GPU組建礦機中心,并在幣圈低潮期逆周期囤積了大量GPU,一路將自己買成了英偉達的“VIP”,享有英偉達顯卡優先配貨權。 2019年,CoreWeave將礦機中心改造為企業級數據中心,為企業級GPU加速工作負載提供AI云服務或者為計算密集型用例構建云解決方案算力,比大型公有云快35倍,但價格便宜80%。 2023年,隨著ChatGPT爆火,英偉達顯卡市場緊俏,連馬斯克都在2023年4月成立X.AI公司,加入AI混戰。賣方市場下,誕生了GPU租賃服務,英偉達GPU成為可抵押融資的“硬通貨”。 2023年8月,CoreWeave抵押其擁有的英偉達H100顯卡,從黑石等機構獲得23億美元債務融資,公司估值達到80億美元。此前2023年4月,CoreWeave完成4.21億美元的B輪融資,投資者包括英偉達,彼時其估值僅20億美元。4個月時間,其估值放大了3倍,足見這個市場的熱度。 2023年6月末,黃仁勛宣布與云計算巨頭Snowflake合作,售賣英偉達的軟件和模型服務。2023年9月有媒體透露,英偉達正計劃向云服務商Lambda Labs投資3億美元,Lambda Labs最早業務是銷售GPU驅動的計算機,后轉型為GPU云服務器租賃,目前主要面向企業出租帶有英偉達芯片的服務器,從而與亞馬遜、微軟、谷歌等云服務商展開競爭。 從谷歌、微軟等科技公司的AI布局可以看到,云服務是AI業務落地的重要抓手和橋梁,英偉達在云服務上的研發、合作、投資將不會停止。 07、頻密投資完善產業鏈, 英偉達AI生態圈擴容 業績大好的英偉達,正在以投資的方式構建以AI為核心的生態圈。 截至2023年7月31日,英偉達賬面趴著58億美元現金和現金等價物,較2022年末的34億美元增長了71%。足夠的錢,是英偉達對外投資的基礎。 不差錢的英偉達,2023年前9個月參與了至少20家AI初創公司的融資,堪比風投機構。要知道,全球最大的獨角獸投資者之一的老虎環球基金(Tiger Global Management)同期也僅投資了30家標的。 其中,AIGC是英偉達投資的主要賽道,2023年英偉達投資了8家相關公司(表5)。這8家公司已在AI領域做出領先產品,其中不乏Inflection AI和Imbue等英偉達的下游客戶。 例如,在2023年6月30日完成13億美元融資的Inflection AI,投資者包括微軟、英偉達和三名個人投資者。融資完成后,其歷史總融資額達15.25億美元,成為融資金額僅次于OpenAI的AIGC初創公司。 該公司由谷歌AI實驗室DeepMind創始人之一的穆斯塔法?蘇萊曼(Mustafa Suleyman)于2022年1月離開谷歌后創立,2023年5月即推出首款產品——名為Pi的AI個人助理,6月發布支持Pi的AI模型Inflection-1,被視為OpenAI勁敵之一。 穆斯塔法?蘇萊曼稱,英偉達和CoreWeave正在為公司部署數千個H100 GPU,投入使用后Inflection的新集群將運行2.2萬個H100 GPU,超過Meta公司的1.6萬個GPU集群。 另外,融資到I輪、估值超過430億美元的Databrick,2023年3月發布ToB端的語言大模型Dolly,4月發布Dolly2.0,可用于構建商業應用程序,有望在B2B生成式AI應用爆發式增長時期占得先機。2023年6月,其以13億美元的對價收購了開源大模型公司MosaicML,該標的也是OpenAI的勁敵之一。強強聯合后,Databrick在AI領域的實力更強,IPO或將提上日程。 AIGC之外,醫藥AI是英偉達聚焦投資的另一核心賽道。據bioSeedin不完全統計,2023年8月、9月及10月第一周,共有29家AI制藥企業完成新一輪融資,披露融資總金額超過16億美元,達到2021年醫藥公司融資巔峰期的1/3,其中6家公司獲得了英偉達的投資(表6)。 例如,上市公司Recursion(RXRX.O)獲得英偉達5000萬美元投資后,宣布將利用英偉達的AIGC云服務來加速AI在生物和化學領域的基礎模型開發,而Recursion也能通過自身龐大的數據來不斷訓練英偉達的AI模型。Iambic Therapeutics宣布將利用英偉達的DGX Cloud AI超級計算平臺和BioNeMo云服務,加速其藥物研發。 作為熟知AI技術路線的產業投資者,英偉達通過投資AI領域的初創企業,并推動這些企業的發展,一方面有助于其緊跟前沿賽道的產品需求,不斷迭代技術,保持競爭優勢,另一方面,成為AI前沿賽道公司的股東后,這些獨角獸無論繼續融資還是上市,英偉達都將獲得不菲的投資收益。 Wind數據顯示,美股披露相關數據的88家半導體及半導體設備上市公司中,2023年10月20日的收盤價高于發行價的占比64%。由此可見,英偉達的投資從開端就大概率會實現雙贏。 除了投資AI下游應用型企業外,英偉達同時向上參與光刻機制造。2023年,英偉達與臺積電、ASML、新思合作發布了計算光刻庫cuLitho。cuLitho可以通過部署有大量GPU的DGX AI計算系統對計算光刻(在芯片設計和制造領域的關鍵步驟,也是最大的計算負載之一)進行加速,使其達到基于CPU計算速度的幾十倍,同時降低計算過程的總能耗,有助于晶圓廠縮短原型周期時間、提高產量、減少碳排放,將長期影響產業發展并累積形成代際差。 以GPU為核心,英偉達向上下游延伸業務,打造更龐大的AI生態圈,它也因此成為AI產業鏈上更重要的存在。 08、股價高位回調12%, 英偉達高增長可持續嗎? 在算力領域全面出擊的英偉達,也不可避免被投資者投了看空票。多位投資人認為,受產能限制,英偉達的股價已提前兌現了未來的業績增長。 我們先看美股半導體行業的整體走勢。受益于OpenAI推出的ChatGPT大模型推動,2022年11月末至2023年7月末,費城半導體指數、標普500指數、納斯達克100指數均走出了氣勢如虹的上揚線,費城半導體指數更終結了此前9個月下跌40%的萎靡(2021年12月至2022年9月),但仍未回升到2021年12月的歷史高點(圖11)。 芯片行業整體仍處在蕭條期。Wind數據顯示,截至2023年10月20日,已披露2023年二季度業績的美股93家半導體企業中,35家企業錄得虧損。其中,英特爾虧損12.77億美元,AMD虧損1.12億美元,美光、安霸虧損額均呈現逐季擴大趨勢(表7)。盈利的高通,凈利潤也同比下滑42.9%。 除了虧損問題,存貨飆漲成為困擾美股半導體企業的另一個問題。2022年末,英特爾的存貨達到132億美元。2023年6月末,高通存貨達69億美元。二者的存貨均創歷史新高。 韓國也不例外,其最大的芯片企業三星電子存貨連續3年攀升,至2023年6月末,存貨達3050億元,創歷史新高。2023年二季度,韓國第二大芯片企業SK海力士因需求疲軟,虧損2.9萬億韓元,同比下跌169%。 同行可比公司普遍承受業績下行和庫存飆漲的雙重壓力下,英偉達股價也由高點回調。2023年8月31日至9月29日,其股價下跌12%,總市值蒸發約1500億美元。同期,費城半導體指數下跌6.5%,標普500指數下跌5%。 值得注意的是,這一波回調,發生在英偉達發布最好二季度業績和250億美元的股票回購計劃之后。 據報道,2023年10月9日,韓國總統辦公室通報,美國同意三星電子和SK海力士向其位于中國的工廠提供設備,無需其他許可。這一變化或將扭轉兩家韓國企業的庫存和虧損問題。這無疑是對蕭條的芯片行業釋放的空前利好,英偉達股價此后連漲兩天。 但是,受拜登政府更新針對AI芯片的出口管制規定影響,費城半導體指數、標普500指數、納斯達克100指數一致下跌,英偉達市值4天內蒸發1163億美元,股價下跌10%。 中國仍是芯片巨頭最大的單一市場。尤其是緊隨OpenAI,2023年中國科技公司興起“百模大戰”,更是釋放了對AI芯片的巨大需求。 中國AI頭號玩家百度,2023年初整合昆侖芯、太行DPU、飛槳深度學習框架、文心大模型、百度智能云等產品,構建AI大底座。AI大底座將千卡并行加速比提升90%以上,訓練場景資源利用率提升70%以上,模型開發迭代效率提升100%以上。目前,其萬卡訓練集群的加速比達到95%,有效訓練時間占比達到了96%,千帆平臺大模型調用量正以每周環比20%的增速攀升。 運營商方面,中國電信將采購I系列/G系列訓練型服務器總計4175臺,InfiniBand交換機總計1182臺。中國移動在上半年業績會上表示,正在建設亞洲最大的智算中心。 這些“基礎設施”的建設中,算力儲備至關重要,而大模型訓練需要大量的英偉達GPU。百川智能創始人、CEO王小川曾對媒體分析指出,在大模型中,GPU的算力成本大概占40%-70%,而其中網絡連接成本和GPU顯卡成本的比例大概為3:1。而從大模型訓練、推理兩部分看,國產AI芯片在數據推理上可以爭取實現國產替代。目前,在模型訓練方面,英偉達做得最好。英偉達GPU在AI訓練領域的市場份額達到95%,且暫時沒有可替代產品或方案。 更重要的是,國內GPU企業面臨生態遷移的難題,眾多基于CUDA的代碼和程序,轉型新生態需要大量的時間和重建成本,以及處理兼容性難題。 有私有云公司的CEO在接受媒體采訪時說,他們的公司也想過轉去買AMD的顯卡,但要把這些顯卡調試到正常運轉至少需要兩個月的時間。而為了縮短這兩個月,英偉達投入370億美元跑了30年。 因此,英偉達在AI算力的領先優勢看起來仍將持續。而不斷增長的中國AI市場,或將再度成為其業績增長的動能。 可怕的是,英偉達還在奮力奔跑。2023年5月,其宣布推出一款新型大內存AI超級計算機,由NVIDIA GH200 Grace Hopper超級芯片和NVIDIA NVLink Switch System驅動的NVIDIA DGX超級計算機,旨在助力開發面向生成式AI語言應用、推薦系統和數據分析工作負載的巨型、下一代模型。 TO B端的英偉達,與下游AI科技公司深度捆綁。未來,市場能否出現低成本的AI算力替換方案,或AI技術路線的顛覆性變革,挑戰其競爭優勢,我們拭目以待。