![]()
編者按:以定力致遠,以重構(gòu)圖新。算力大象新聞、億美元加拿大28结果预测大神网大象財富聯(lián)合騰訊新聞、分岔騰訊科技推出2025年終策劃《定力與重構(gòu)》,中美回望2025、算力展望2026,億美元讓洞察照見本質(zhì),分岔向變革尋求確定。中美
“全球人工智能投資規(guī)模2025年或?qū)⒔咏?000億美元。算力”高盛8月份的億美元一份報告中寫道。
雖然爭奪算力是分岔追逐超級智能的明牌項,但中、中美美這兩個最大的算力玩家,卻站在分岔路口:中國這邊不斷地在性能上追分,億美元美國那邊雖沒有被算力困住,卻被能源所“卡脖子”。
時針撥回到2023、2024年,搶算力成為“全球共識”——無論硅谷巨頭、主權(quán)基金,無不寄希望從英偉達的手里,搶到更多的H100產(chǎn)能。
但是站在2025年年末回看,盡管搶算力的趨勢沒有根本改變,但各大云廠下單為了計算總擁有成本,已經(jīng)把計算器按冒煙。
在英偉達的身后,谷歌十年磨一劍,在Gemini 3的訓(xùn)練上讓自研芯片TPU脫穎而出,為專用集成電路(ASIC)贏得極其重要的話語權(quán)。
在谷歌身后,亞馬遜、Meta、微軟一眾老巨頭,以及OpenAI、xAI這樣的新貴,無一例外的下場自研。
資本市場隨即給出結(jié)論:英偉達市值上限5萬億美金。
2025年下半年之前,泡沫并不是主旋律,但隨著山姆·奧特曼拿出1.4萬億美元的加拿大28结果预测大神网龐大基礎(chǔ)設(shè)施建設(shè)計劃,尤其是背后的循環(huán)交易、舉債融資,引發(fā)外界對泡沫的擔(dān)憂。
泡沫理應(yīng)關(guān)注,但在先進算力禁運的背景下,泡沫顯然不是中國算力、大模型的重點。
相比硅谷,中國AI產(chǎn)業(yè)走的非常曲折、艱難,但成果也頗豐——我們有世界頂級的開源模型,有成熟的應(yīng)用生態(tài),更有數(shù)倍于硅谷明顯公司們的Tokens使用量。
在有限的空間里,過去中國大模型一直使用英偉達供應(yīng)的“閹割版”次等芯片,但今年開始,這個趨勢將慢慢得到改變——機構(gòu)伯恩斯坦的數(shù)據(jù)顯示,中國本土AI芯片品牌滲透率已從2024年的約29%,快速提升至接近60%。
同期,中國英偉達們紛紛沖刺上市,背后是中美科技競爭加劇和國產(chǎn)替代需求的爆發(fā)。
在這個大環(huán)境下,越來越多的中國芯片企業(yè)試圖通過“超節(jié)點”的形式,以繞開單芯片性不足的問題,這反映出中國人工智能產(chǎn)業(yè)的智慧和韌性。
01 硅谷巨頭:從CapEx到CapEx+TCO
回望2023與2024年,全球AI算力市場的主旋律是恐慌與搶購,在那兩年里,無論是硅谷巨頭還是主權(quán)基金,唯一的KPI就是搶到盡可能多的H100。
根據(jù)UBS的數(shù)據(jù),2025年全球AI芯片市場規(guī)模雖然預(yù)計將突破2000億美元,但增長的內(nèi)驅(qū)力已發(fā)生質(zhì)變。
現(xiàn)在的云廠商在下單前,不再只盯著性能參數(shù),而是開始拿著計算器審視TCO(總擁有成本)。
![]()
今年美國主要云服務(wù)提供商如亞馬遜AWS、微軟Azure和谷歌云,正以前所未有的激進姿態(tài)加大資本開支(CapEx)。
高盛預(yù)測,2025年五大巨頭的資本支出將達到3800億美元,用于AI基礎(chǔ)設(shè)施擴張和數(shù)據(jù)中心建設(shè),以應(yīng)對爆炸式增長的計算需求。到2027年,總規(guī)模將超過5400億美元。
云長的投資反映了激烈的競爭,但和以往不同,所有人都不得不考慮效率問題,不得不精打細算考慮經(jīng)濟賬。
在這個過程中,還有一個值得關(guān)注的信號:2025年的算力市場不再是單純的“賣卡”生意,數(shù)據(jù)中心的基建進入了機架級時代。
如今,交付到云廠商的是集成了計算、高速互聯(lián)、甚至液冷系統(tǒng)的完整機柜。與此同時,由于單機架功耗普遍突破100kW,電力供應(yīng)已成為限制2025年算力總量釋放的物理天花板,而非芯片產(chǎn)能本身。
今年AI產(chǎn)業(yè)的另一一個顯著的標(biāo)志就是推理的需求越來越多。算力中心的工作負載正從“暴力堆算力跑訓(xùn)練”轉(zhuǎn)向“大規(guī)模、高并發(fā)的推理調(diào)度”。
![]()
大摩預(yù)測,2026年推理算力需求將超過訓(xùn)練需求。
這意味著,市場對芯片的要求不再僅僅是單卡極致的算力峰值,而是單位成本下的Token輸出效率。
這種需求偏移,也變相給了非英偉達陣營更多生存空間,因為在推理側(cè),性價比往往比絕對生態(tài)優(yōu)勢更具殺傷力。
當(dāng)然,推理需求的暴漲也給廣大的“賽博玩家”一記暴擊——存儲價格暴漲。
02 英偉達是“一超”,谷歌領(lǐng)銜“多強”
2025年,數(shù)據(jù)中心AI芯片市場呈現(xiàn)典型的“一超多強”格局。
憑借Blackwell架構(gòu)的領(lǐng)先性能、NVLink互聯(lián)生態(tài)和大規(guī)模部署,英偉達占據(jù)主導(dǎo)地位,市場份額約占80%以上,憑借年度旗艦GB200&GB300系列,繼續(xù)以“一超”的姿態(tài),主導(dǎo)訓(xùn)練和推理領(lǐng)域。
AMD、谷歌、亞馬遜、微軟和Meta作為“多強”,通過自研ASIC加速器,積極優(yōu)化內(nèi)部云基礎(chǔ)設(shè)施、降低成本并逐步向外部開放,挑戰(zhàn)英偉達的壟斷。
這些公司主要從自身大規(guī)模AI需求出發(fā),開發(fā)專用芯片,強調(diào)能效、規(guī)模化和特定工作負載優(yōu)化。
![]()
AMD通過Instinct MI系列在數(shù)據(jù)中心市場快速崛起,已吸引Meta、微軟和Oracle等客戶。
2025年MI350系列已大規(guī)模可用,在某些MoE模型上性價比突出。MI400系列計劃2026年推出,支持更大規(guī)模機架級集成。
亞馬遜AWS的自研Trainium系列針對數(shù)據(jù)中心訓(xùn)練和推理,Trainium3 采用3nm工藝,支持144芯片集成,峰值超362 PFLOPS,專門針對Agent代理、推理和視頻生成等下一代應(yīng)用優(yōu)化,支持PyTorch/JAX無縫遷移,可擴展至百萬芯片超大規(guī)模集群。
亞馬遜策略是垂直整合Bedrock平臺,吸引Anthropic等客戶,顯著降低token成本,在AWS生態(tài)內(nèi)提供高性價比替代。
Meta的MTIA系列專注內(nèi)部數(shù)據(jù)中心推薦和排名模型,核心策略是基礎(chǔ)設(shè)施自主化,減少成本,主要內(nèi)部使用(如Facebook/Instagram推薦),尚未外部開放,但正擴展至生成AI訓(xùn)練。
2025年下一代MTIA(基于5nm)已測試并部署,提供3.5倍密集計算和7倍稀疏計算提升,內(nèi)存帶寬翻倍,效率較GPU高2倍。MTIA與下一代GPU協(xié)同,支持Llama系列推理。
和其他巨頭一樣,微軟過去兩年也在推動自研Maia系列,但一直“掉鏈子”。
Maia系列的首款產(chǎn)品Maia 100在2023年底發(fā)布,被視為微軟進軍自研芯片的標(biāo)志性動作,不過參數(shù)遠不及同行同期的產(chǎn)品。Maia 200更是一波三折:原計劃2024年完成流片,但設(shè)計過程中出現(xiàn)多個技術(shù)問題,導(dǎo)致流片延遲至2024年底,2025年才啟動量產(chǎn)。
根據(jù)SemiAnalysis的信息,Maia 200的性能未達預(yù)期,被內(nèi)部評估為失敗項目,即便量產(chǎn)也難以支撐核心AI工作負載。而計劃在2027年部署的Maia 300,雖然瞄準 2nm工藝,目標(biāo)是接近內(nèi)部性能預(yù)期。
在“多強”的陣容當(dāng)中,不得不提的是谷歌十年磨一劍的TPU。
谷歌的TPU系列專注云端數(shù)據(jù)中心,最新的第七代Ironwood支持高達9216芯片的節(jié)點規(guī)模,提供超過4倍于前代Trillium的單芯片性能。
都在說ASIC在慢慢趕超GPU,但對英偉達來說,真正意義上的變數(shù)還要數(shù)谷歌TPU。
長期以來,TPU作為谷歌內(nèi)部AI工作負載的核心支撐,主要服務(wù)于搜索推薦、廣告等業(yè)務(wù),即便 2018 年通過谷歌云對外開放,也未推進全面商業(yè)化。
近幾個月,這一局面發(fā)生根本性轉(zhuǎn)變:谷歌調(diào)動全技術(shù)棧資源,通過 “云端服務(wù)+硬件直售” 雙路徑開放TPU能力,正式以硬件供應(yīng)商身份入局AI算力市場。
這一戰(zhàn)略轉(zhuǎn)型已取得顯著成效:Anthropic、Meta、OpenAI、xAI等頭部機構(gòu)陸續(xù)加入TPU采購隊列,其中Anthropic與谷歌的合作堪稱標(biāo)桿——不僅部署規(guī)模超 1GW 的TPU計算集群,更簽訂100萬個TPU的合作協(xié)議,分兩階段落地40萬個直供TPUv7 Ironwood和60萬個GCP租用 TPUv7,對應(yīng)訂單金額超520億美元。
訂單背后,關(guān)鍵支撐在于:Gemini 3、Opus 4.5這些業(yè)界領(lǐng)先模型,均基于該芯片訓(xùn)練,所謂“好不好看療效”。
不過,TPU的過去10年研發(fā)路,也不是一帆風(fēng)順,TPUv4、v5的計算吞吐量曾顯著落后于同期英偉達旗艦產(chǎn)品,直到TPUv6通過將脈動陣列規(guī)模從128×128 提升至 256×256,實現(xiàn)算力翻倍且能耗降低。TPUv7則沿用3D環(huán)面(3D Torus)架構(gòu),在實際場景中展現(xiàn)出更優(yōu)的 TCO 表現(xiàn)。
現(xiàn)在,很多網(wǎng)友們都在討論TPU進入國內(nèi)的可能性,有兩個關(guān)鍵問題:其一是性能超規(guī),這很好理解;其二是生態(tài)問題。
生態(tài)問題上,即便在北美,大家都是租用谷歌云上的TPU算力,如果云廠自己買回去建TPU集群,會增加非常多的調(diào)試時間,而且還要學(xué)會使用TPU的軟件生態(tài),在沒有谷歌的支持下,難度可想而知。
03 “中國英偉達”上市潮、超節(jié)點與華為昇騰
2025年,對于中國的AI芯片來說,是不平凡的一年。
寒武紀在今年走出了一波大行情,市值最高一度突破6000億,成為A股AI芯片龍頭標(biāo)桿。摩爾線程和沐曦也成功在科創(chuàng)板上市。
其他幾個耳熟能詳?shù)膰a(chǎn)AI廠商,比如壁仞科技、天數(shù)智芯、遂原科技、昆侖芯也基本都在上市的路上。
這一輪國產(chǎn)AI芯片上市潮背后,是中美科技競爭加劇和國產(chǎn)替代需求的爆發(fā)——美國對高端GPU的出口管制,推動國內(nèi)巨頭和初創(chuàng)企業(yè)加速自主研發(fā),同時資本市場對AI算力的追捧,讓這些高研發(fā)投入的公司迎來融資窗口期。
盡管多數(shù)企業(yè)仍處于虧損階段,但高估值反映了投資者對未來國產(chǎn)芯片在智算中心、大模型訓(xùn)練等領(lǐng)域的期待,這一潮涌不僅帶來了資金活水,也標(biāo)志著中國AI芯片產(chǎn)業(yè)從“跟跑”向“并跑”邁進的關(guān)鍵轉(zhuǎn)折。
之所以說是關(guān)鍵轉(zhuǎn)折,原因在于,2023年英偉達憑借其CUDA生態(tài)和領(lǐng)先的GPU性能,幾乎壟斷了全球和中國AI算力市場,市場份額一度高達80%以上,尤其在數(shù)據(jù)中心和訓(xùn)練大模型領(lǐng)域,英偉達的H100和A100系列芯片成為不可或缺的核心,國產(chǎn)廠商難以撼動其地位。
受美國出口管制的持續(xù)影響,特別是對先進AI芯片的禁售,英偉達在中國市場的份額急劇下滑,這為國產(chǎn)GPU提供了絕佳的滲透機會。
根據(jù)伯恩斯坦的數(shù)據(jù),本土AI芯片品牌滲透率已從2024年的約29%快速提升至2025年的59%以上,特別是在智算中心和云服務(wù)領(lǐng)域,國產(chǎn)芯片的采用率顯著上升。
![]()
轉(zhuǎn)變得益于“國產(chǎn)替代”的強勢推動和產(chǎn)業(yè)鏈的加速成熟。
具體來說,華為的Ascend系列性能已接近英偉達H200的80%,并在多家數(shù)據(jù)中心大規(guī)模部署;其他廠商如阿里的PPU、昆侖芯、寒武紀、壁仞、天數(shù)智芯和燧原,也通過異構(gòu)計算和生態(tài)兼容性提升,逐步蠶食市場空白。
整體而言,中國AI芯片市場正從英偉達“一超獨大”的壟斷格局,向“百花齊放”的多強競爭演變。
預(yù)計到2026年,國產(chǎn)GPU在國內(nèi)滲透率將進一步突破,這不僅降低了供應(yīng)鏈風(fēng)險,還推動了AI算力的自主可控和成本優(yōu)化。
單芯片性能在不斷追趕,整個算力產(chǎn)業(yè)都涌向“超節(jié)點”,以規(guī)避單芯片性能還不足的問題,更提現(xiàn)了中國人的智慧。
超節(jié)點是將大量AI加速卡通過高速互聯(lián)整合成邏輯上統(tǒng)一的“巨型計算機”,有效解決傳統(tǒng)集群通信延遲高、擴展性差等問題,支持萬億參數(shù)模型高效訓(xùn)練和推理。
目前,中國已推出多款商用超節(jié)點產(chǎn)品,單節(jié)點規(guī)模從128卡到640卡不等,技術(shù)路線涵蓋電互連、光互連和開放架構(gòu)。
互聯(lián)技術(shù)是國產(chǎn)超節(jié)點的核心突破,傳統(tǒng)以太網(wǎng)和PCIe難以滿足萬卡級通信需求,頭部廠商自研高速協(xié)議成為標(biāo)配:華為“靈衢”協(xié)議單芯片互聯(lián)帶寬達2TB/s、卡間延遲僅2.1微秒;海光/曙光HSL協(xié)議支持112G高速互聯(lián),并通過專用交換芯片實現(xiàn)節(jié)點內(nèi)全帶寬點對點互聯(lián),避免出節(jié)點轉(zhuǎn)發(fā),這種低延遲、高帶寬設(shè)計極大降低了分布式訓(xùn)練中的通信開銷。
目前,已有多個超節(jié)點項目落地,但大規(guī)模商用預(yù)計2026年真正爆發(fā),所以我們也常說,2026年將迎來“超節(jié)點戰(zhàn)爭”。
盡管超節(jié)點可以部分補齊單芯片算力不足的問題,但挑戰(zhàn)仍然存在,包括軟件生態(tài)優(yōu)化、先進制程與HBM產(chǎn)能瓶頸。關(guān)于國產(chǎn)算力,不得不提的是華為。根據(jù)IDC的數(shù)據(jù),明年昇騰的出貨量將占比中國AI芯片總出貨量的一半。
9月份的全連接大會上,華為直接亮出了昇騰系列路線圖。
根據(jù)規(guī)劃,2026年至2028年,華為將分階段推出四款新芯片:2026年第一季度發(fā)布昇騰950 PR(專注推理Prefill和推薦場景);2026年第四季度推出昇騰950 DT;2027年第四季度推出昇騰960;2028年第四季度推出昇騰970。
![]()
昇騰AI芯片路線圖
這一路線圖延續(xù)了昇騰從910系列(2018年起)到910C(2025年推出)的迭代路徑,結(jié)合Atlas超節(jié)點技術(shù),支持大規(guī)模集群部署。
關(guān)于昇騰的950 PR,最近大家在網(wǎng)上都能看到一些性能參數(shù),對華為來說,其目前的核心并不是在訓(xùn)練上要去掉英偉達,而且讓自己的芯片被更多的用戶使用起來。有可能會被忽視的關(guān)鍵數(shù)據(jù):在950 PR中,增加了SIMT/FP8/F4,這些都對推理有明顯的改善。
04 有泡沫,那就擠掉
當(dāng)奧特曼的1.4萬億美元投資重塑AI產(chǎn)業(yè)格局,當(dāng)英偉達市值一路飆升至5萬億美元,當(dāng)AI概念股成為資本市場的香餑餑,關(guān)于AI是否處于泡沫的爭論變得異常激烈。
有人將當(dāng)前的資本狂熱比作 2000年互聯(lián)網(wǎng)泡沫的重現(xiàn),也有人堅信這是技術(shù)革命的必然序曲,這些都是基于不同視角、立場得出的洞察,都有存在的合理性。
樂觀派堅定看好AI的長期價值,認為當(dāng)前的高投入與高估值并非炒作,強調(diào)AI將創(chuàng)造20萬億美元的經(jīng)濟價值,僅生成式AI就有望提升勞動生產(chǎn)率15%,這種技術(shù)賦能的潛力足以支撐資本的熱情。
從數(shù)據(jù)來看,以英偉達為代表的龍頭企業(yè)并非空談概念,其憑借GPU技術(shù)占據(jù)AI價值鏈35-40% 的資本支出份額,2025年營收預(yù)計超2000億美元,扎實的盈利能力成為估值的重要支撐。
謹慎派則認為市場存在潛在的風(fēng)險,企業(yè)對債務(wù)融資的依賴度不斷上升, 五大AI超大規(guī)模企業(yè)現(xiàn)金資產(chǎn)占比已從2021年底的29%降至2025年二季度的15%,債券與私人信貸成為主要融資渠道。
更值得關(guān)注的是,AI產(chǎn)業(yè)呈現(xiàn)明顯的結(jié)構(gòu)性失衡:上游算力硬件景氣度高漲,但中游多數(shù)初創(chuàng)模型企業(yè)缺乏商業(yè)化能力,下游80%部署AI的企業(yè)尚未實現(xiàn)凈利潤提升。
換句話說,源源不斷地投錢,卻沒有在商業(yè)收入上高效轉(zhuǎn)化。
判斷AI是否處于泡沫,不能僅憑市場熱度,而需從估值水平、盈利支撐、產(chǎn)業(yè)邏輯三個核心維度理性分析。
從估值來看,當(dāng)前美國科技巨頭的估值并未達到歷史泡沫峰值。
被稱為“美股七姐妹” 的核心科技股當(dāng)前市盈率約31倍,遠低于2000年互聯(lián)網(wǎng)泡沫時期的極端水平。
更重要的是,這些企業(yè)大多具備強勁的現(xiàn)金流和造血能力,與當(dāng)年缺乏盈利支撐的互聯(lián)網(wǎng)初創(chuàng)企業(yè)有本質(zhì)區(qū)別。
從產(chǎn)業(yè)邏輯來看,美國AI硬件投資自2023年已增長2000-3000億美元,數(shù)據(jù)中心、算力基礎(chǔ)設(shè)施的建設(shè)雖然存在局部過熱跡象,但背后是真實的產(chǎn)業(yè)需求支撐。谷歌TPU芯片對外供貨引發(fā)的“鲇魚效應(yīng)”,更證明AI產(chǎn)業(yè)正從壟斷走向多元共生。
關(guān)于部分企業(yè)“閉環(huán)買賣”的模式——英偉達投資xAI后xAI隨即采購其芯片,微軟投資OpenAI后獲得巨額云服務(wù)訂單——可能導(dǎo)致估值虛高,進而帶來局部泡沫,尤其是美國前十大科技股占全球股市近25%的極高集中度,也讓市場波動的傳導(dǎo)風(fēng)險不容忽視。
但市場不是從來就是二八分化,優(yōu)勢資源集中在20%的機構(gòu)手里?
從我們的視角來看,所謂AI泡沫:只是短期利益與長期價值、資本狂歡與技術(shù)本質(zhì)的博弈。
即便是真有泡沫,擠掉就是。
文丨傅里葉的貓 海軍
編輯丨蘇揚 史蓓蓓
主編|成書麗
監(jiān)制|付天喜