軟文推廣的網(wǎng)站

核心要點

圖片


編者按:以定力致遠,以重構圖新。算力大象新聞、億美元加拿大28是骗局么大象財富聯(lián)合騰訊新聞、分岔騰訊科技推出2025年終策劃《定力與重構》,中美回望2025、算力展望2026,億美元讓洞察照見本質,分岔向變革尋求確定。中美

“全球人工智能投資規(guī)模2025年或將接近2000億美元。算力”高盛8月份的億美元一份報告中寫道。

雖然爭奪算力是分岔追逐超級智能的明牌項,但中、中美美這兩個最大的算力玩家,卻站在分岔路口:中國這邊不斷地在性能上追分,億美元美國那邊雖沒有被算力困住,卻被能源所“卡脖子”。

時針撥回到2023、2024年,搶算力成為“全球共識”——無論硅谷巨頭、主權基金,無不寄希望從英偉達的手里,搶到更多的H100產能。

但是站在2025年年末回看,盡管搶算力的趨勢沒有根本改變,但各大云廠下單為了計算總擁有成本,已經把計算器按冒煙。

在英偉達的身后,谷歌十年磨一劍,在Gemini 3的訓練上讓自研芯片TPU脫穎而出,為專用集成電路(ASIC)贏得極其重要的話語權。

在谷歌身后,亞馬遜、Meta、微軟一眾老巨頭,以及OpenAI、xAI這樣的新貴,無一例外的下場自研。

資本市場隨即給出結論:英偉達市值上限5萬億美金。

2025年下半年之前,泡沫并不是主旋律,但隨著山姆·奧特曼拿出1.4萬億美元的加拿大28是骗局么龐大基礎設施建設計劃,尤其是背后的循環(huán)交易、舉債融資,引發(fā)外界對泡沫的擔憂。

泡沫理應關注,但在先進算力禁運的背景下,泡沫顯然不是中國算力、大模型的重點。

相比硅谷,中國AI產業(yè)走的非常曲折、艱難,但成果也頗豐——我們有世界頂級的開源模型,有成熟的應用生態(tài),更有數(shù)倍于硅谷明顯公司們的Tokens使用量。

在有限的空間里,過去中國大模型一直使用英偉達供應的“閹割版”次等芯片,但今年開始,這個趨勢將慢慢得到改變——機構伯恩斯坦的數(shù)據(jù)顯示,中國本土AI芯片品牌滲透率已從2024年的約29%,快速提升至接近60%。

同期,中國英偉達們紛紛沖刺上市,背后是中美科技競爭加劇和國產替代需求的爆發(fā)。

在這個大環(huán)境下,越來越多的中國芯片企業(yè)試圖通過“超節(jié)點”的形式,以繞開單芯片性不足的問題,這反映出中國人工智能產業(yè)的智慧和韌性。

01 硅谷巨頭:從CapEx到CapEx+TCO

回望2023與2024年,全球AI算力市場的主旋律是恐慌與搶購,在那兩年里,無論是硅谷巨頭還是主權基金,唯一的KPI就是搶到盡可能多的H100。

根據(jù)UBS的數(shù)據(jù),2025年全球AI芯片市場規(guī)模雖然預計將突破2000億美元,但增長的內驅力已發(fā)生質變。

現(xiàn)在的云廠商在下單前,不再只盯著性能參數(shù),而是開始拿著計算器審視TCO(總擁有成本)。



今年美國主要云服務提供商如亞馬遜AWS、微軟Azure和谷歌云,正以前所未有的激進姿態(tài)加大資本開支(CapEx)。

高盛預測,2025年五大巨頭的資本支出將達到3800億美元,用于AI基礎設施擴張和數(shù)據(jù)中心建設,以應對爆炸式增長的計算需求。到2027年,總規(guī)模將超過5400億美元。

云長的投資反映了激烈的競爭,但和以往不同,所有人都不得不考慮效率問題,不得不精打細算考慮經濟賬。

在這個過程中,還有一個值得關注的信號:2025年的算力市場不再是單純的“賣卡”生意,數(shù)據(jù)中心的基建進入了機架級時代。

如今,交付到云廠商的是集成了計算、高速互聯(lián)、甚至液冷系統(tǒng)的完整機柜。與此同時,由于單機架功耗普遍突破100kW,電力供應已成為限制2025年算力總量釋放的物理天花板,而非芯片產能本身。

今年AI產業(yè)的另一一個顯著的標志就是推理的需求越來越多。算力中心的工作負載正從“暴力堆算力跑訓練”轉向“大規(guī)模、高并發(fā)的推理調度”。


大摩預測,2026年推理算力需求將超過訓練需求。

這意味著,市場對芯片的要求不再僅僅是單卡極致的算力峰值,而是單位成本下的Token輸出效率。

這種需求偏移,也變相給了非英偉達陣營更多生存空間,因為在推理側,性價比往往比絕對生態(tài)優(yōu)勢更具殺傷力。

當然,推理需求的暴漲也給廣大的“賽博玩家”一記暴擊——存儲價格暴漲。

02 英偉達是“一超”,谷歌領銜“多強”

2025年,數(shù)據(jù)中心AI芯片市場呈現(xiàn)典型的“一超多強”格局。

憑借Blackwell架構的領先性能、NVLink互聯(lián)生態(tài)和大規(guī)模部署,英偉達占據(jù)主導地位,市場份額約占80%以上,憑借年度旗艦GB200&GB300系列,繼續(xù)以“一超”的姿態(tài),主導訓練和推理領域。

AMD、谷歌、亞馬遜、微軟和Meta作為“多強”,通過自研ASIC加速器,積極優(yōu)化內部云基礎設施、降低成本并逐步向外部開放,挑戰(zhàn)英偉達的壟斷。

這些公司主要從自身大規(guī)模AI需求出發(fā),開發(fā)專用芯片,強調能效、規(guī)模化和特定工作負載優(yōu)化。


AMD通過Instinct MI系列在數(shù)據(jù)中心市場快速崛起,已吸引Meta、微軟和Oracle等客戶。

2025年MI350系列已大規(guī)模可用,在某些MoE模型上性價比突出。MI400系列計劃2026年推出,支持更大規(guī)模機架級集成。

亞馬遜AWS的自研Trainium系列針對數(shù)據(jù)中心訓練和推理,Trainium3 采用3nm工藝,支持144芯片集成,峰值超362 PFLOPS,專門針對Agent代理、推理和視頻生成等下一代應用優(yōu)化,支持PyTorch/JAX無縫遷移,可擴展至百萬芯片超大規(guī)模集群。

亞馬遜策略是垂直整合Bedrock平臺,吸引Anthropic等客戶,顯著降低token成本,在AWS生態(tài)內提供高性價比替代。

Meta的MTIA系列專注內部數(shù)據(jù)中心推薦和排名模型,核心策略是基礎設施自主化,減少成本,主要內部使用(如Facebook/Instagram推薦),尚未外部開放,但正擴展至生成AI訓練。

2025年下一代MTIA(基于5nm)已測試并部署,提供3.5倍密集計算和7倍稀疏計算提升,內存帶寬翻倍,效率較GPU高2倍。MTIA與下一代GPU協(xié)同,支持Llama系列推理。

和其他巨頭一樣,微軟過去兩年也在推動自研Maia系列,但一直“掉鏈子”。

Maia系列的首款產品Maia 100在2023年底發(fā)布,被視為微軟進軍自研芯片的標志性動作,不過參數(shù)遠不及同行同期的產品。Maia 200更是一波三折:原計劃2024年完成流片,但設計過程中出現(xiàn)多個技術問題,導致流片延遲至2024年底,2025年才啟動量產。

根據(jù)SemiAnalysis的信息,Maia 200的性能未達預期,被內部評估為失敗項目,即便量產也難以支撐核心AI工作負載。而計劃在2027年部署的Maia 300,雖然瞄準 2nm工藝,目標是接近內部性能預期。

在“多強”的陣容當中,不得不提的是谷歌十年磨一劍的TPU。

谷歌的TPU系列專注云端數(shù)據(jù)中心,最新的第七代Ironwood支持高達9216芯片的節(jié)點規(guī)模,提供超過4倍于前代Trillium的單芯片性能。

都在說ASIC在慢慢趕超GPU,但對英偉達來說,真正意義上的變數(shù)還要數(shù)谷歌TPU。

長期以來,TPU作為谷歌內部AI工作負載的核心支撐,主要服務于搜索推薦、廣告等業(yè)務,即便 2018 年通過谷歌云對外開放,也未推進全面商業(yè)化。

近幾個月,這一局面發(fā)生根本性轉變:谷歌調動全技術棧資源,通過 “云端服務+硬件直售” 雙路徑開放TPU能力,正式以硬件供應商身份入局AI算力市場。

這一戰(zhàn)略轉型已取得顯著成效:Anthropic、Meta、OpenAI、xAI等頭部機構陸續(xù)加入TPU采購隊列,其中Anthropic與谷歌的合作堪稱標桿——不僅部署規(guī)模超 1GW 的TPU計算集群,更簽訂100萬個TPU的合作協(xié)議,分兩階段落地40萬個直供TPUv7 Ironwood和60萬個GCP租用 TPUv7,對應訂單金額超520億美元。

訂單背后,關鍵支撐在于:Gemini 3、Opus 4.5這些業(yè)界領先模型,均基于該芯片訓練,所謂“好不好看療效”。

不過,TPU的過去10年研發(fā)路,也不是一帆風順,TPUv4、v5的計算吞吐量曾顯著落后于同期英偉達旗艦產品,直到TPUv6通過將脈動陣列規(guī)模從128×128 提升至 256×256,實現(xiàn)算力翻倍且能耗降低。TPUv7則沿用3D環(huán)面(3D Torus)架構,在實際場景中展現(xiàn)出更優(yōu)的 TCO 表現(xiàn)。

現(xiàn)在,很多網(wǎng)友們都在討論TPU進入國內的可能性,有兩個關鍵問題:其一是性能超規(guī),這很好理解;其二是生態(tài)問題。

生態(tài)問題上,即便在北美,大家都是租用谷歌云上的TPU算力,如果云廠自己買回去建TPU集群,會增加非常多的調試時間,而且還要學會使用TPU的軟件生態(tài),在沒有谷歌的支持下,難度可想而知。

03 “中國英偉達”上市潮、超節(jié)點與華為昇騰

2025年,對于中國的AI芯片來說,是不平凡的一年。

寒武紀在今年走出了一波大行情,市值最高一度突破6000億,成為A股AI芯片龍頭標桿。摩爾線程和沐曦也成功在科創(chuàng)板上市。

其他幾個耳熟能詳?shù)膰aAI廠商,比如壁仞科技、天數(shù)智芯、遂原科技、昆侖芯也基本都在上市的路上。

這一輪國產AI芯片上市潮背后,是中美科技競爭加劇和國產替代需求的爆發(fā)——美國對高端GPU的出口管制,推動國內巨頭和初創(chuàng)企業(yè)加速自主研發(fā),同時資本市場對AI算力的追捧,讓這些高研發(fā)投入的公司迎來融資窗口期。

盡管多數(shù)企業(yè)仍處于虧損階段,但高估值反映了投資者對未來國產芯片在智算中心、大模型訓練等領域的期待,這一潮涌不僅帶來了資金活水,也標志著中國AI芯片產業(yè)從“跟跑”向“并跑”邁進的關鍵轉折。

之所以說是關鍵轉折,原因在于,2023年英偉達憑借其CUDA生態(tài)和領先的GPU性能,幾乎壟斷了全球和中國AI算力市場,市場份額一度高達80%以上,尤其在數(shù)據(jù)中心和訓練大模型領域,英偉達的H100和A100系列芯片成為不可或缺的核心,國產廠商難以撼動其地位。

受美國出口管制的持續(xù)影響,特別是對先進AI芯片的禁售,英偉達在中國市場的份額急劇下滑,這為國產GPU提供了絕佳的滲透機會。

根據(jù)伯恩斯坦的數(shù)據(jù),本土AI芯片品牌滲透率已從2024年的約29%快速提升至2025年的59%以上,特別是在智算中心和云服務領域,國產芯片的采用率顯著上升。


轉變得益于“國產替代”的強勢推動和產業(yè)鏈的加速成熟。

具體來說,華為的Ascend系列性能已接近英偉達H200的80%,并在多家數(shù)據(jù)中心大規(guī)模部署;其他廠商如阿里的PPU、昆侖芯、寒武紀、壁仞、天數(shù)智芯和燧原,也通過異構計算和生態(tài)兼容性提升,逐步蠶食市場空白。

整體而言,中國AI芯片市場正從英偉達“一超獨大”的壟斷格局,向“百花齊放”的多強競爭演變。

預計到2026年,國產GPU在國內滲透率將進一步突破,這不僅降低了供應鏈風險,還推動了AI算力的自主可控和成本優(yōu)化。

單芯片性能在不斷追趕,整個算力產業(yè)都涌向“超節(jié)點”,以規(guī)避單芯片性能還不足的問題,更提現(xiàn)了中國人的智慧。

超節(jié)點是將大量AI加速卡通過高速互聯(lián)整合成邏輯上統(tǒng)一的“巨型計算機”,有效解決傳統(tǒng)集群通信延遲高、擴展性差等問題,支持萬億參數(shù)模型高效訓練和推理。

目前,中國已推出多款商用超節(jié)點產品,單節(jié)點規(guī)模從128卡到640卡不等,技術路線涵蓋電互連、光互連和開放架構。

互聯(lián)技術是國產超節(jié)點的核心突破,傳統(tǒng)以太網(wǎng)和PCIe難以滿足萬卡級通信需求,頭部廠商自研高速協(xié)議成為標配:華為“靈衢”協(xié)議單芯片互聯(lián)帶寬達2TB/s、卡間延遲僅2.1微秒;海光/曙光HSL協(xié)議支持112G高速互聯(lián),并通過專用交換芯片實現(xiàn)節(jié)點內全帶寬點對點互聯(lián),避免出節(jié)點轉發(fā),這種低延遲、高帶寬設計極大降低了分布式訓練中的通信開銷。

目前,已有多個超節(jié)點項目落地,但大規(guī)模商用預計2026年真正爆發(fā),所以我們也常說,2026年將迎來“超節(jié)點戰(zhàn)爭”。

盡管超節(jié)點可以部分補齊單芯片算力不足的問題,但挑戰(zhàn)仍然存在,包括軟件生態(tài)優(yōu)化、先進制程與HBM產能瓶頸。關于國產算力,不得不提的是華為。根據(jù)IDC的數(shù)據(jù),明年昇騰的出貨量將占比中國AI芯片總出貨量的一半。

9月份的全連接大會上,華為直接亮出了昇騰系列路線圖。

根據(jù)規(guī)劃,2026年至2028年,華為將分階段推出四款新芯片:2026年第一季度發(fā)布昇騰950 PR(專注推理Prefill和推薦場景);2026年第四季度推出昇騰950 DT;2027年第四季度推出昇騰960;2028年第四季度推出昇騰970。


昇騰AI芯片路線圖

這一路線圖延續(xù)了昇騰從910系列(2018年起)到910C(2025年推出)的迭代路徑,結合Atlas超節(jié)點技術,支持大規(guī)模集群部署。

關于昇騰的950 PR,最近大家在網(wǎng)上都能看到一些性能參數(shù),對華為來說,其目前的核心并不是在訓練上要去掉英偉達,而且讓自己的芯片被更多的用戶使用起來。有可能會被忽視的關鍵數(shù)據(jù):在950 PR中,增加了SIMT/FP8/F4,這些都對推理有明顯的改善。

04 有泡沫,那就擠掉

當奧特曼的1.4萬億美元投資重塑AI產業(yè)格局,當英偉達市值一路飆升至5萬億美元,當AI概念股成為資本市場的香餑餑,關于AI是否處于泡沫的爭論變得異常激烈。

有人將當前的資本狂熱比作 2000年互聯(lián)網(wǎng)泡沫的重現(xiàn),也有人堅信這是技術革命的必然序曲,這些都是基于不同視角、立場得出的洞察,都有存在的合理性。

樂觀派堅定看好AI的長期價值,認為當前的高投入與高估值并非炒作,強調AI將創(chuàng)造20萬億美元的經濟價值,僅生成式AI就有望提升勞動生產率15%,這種技術賦能的潛力足以支撐資本的熱情。

從數(shù)據(jù)來看,以英偉達為代表的龍頭企業(yè)并非空談概念,其憑借GPU技術占據(jù)AI價值鏈35-40% 的資本支出份額,2025年營收預計超2000億美元,扎實的盈利能力成為估值的重要支撐。

謹慎派則認為市場存在潛在的風險,企業(yè)對債務融資的依賴度不斷上升, 五大AI超大規(guī)模企業(yè)現(xiàn)金資產占比已從2021年底的29%降至2025年二季度的15%,債券與私人信貸成為主要融資渠道。

更值得關注的是,AI產業(yè)呈現(xiàn)明顯的結構性失衡:上游算力硬件景氣度高漲,但中游多數(shù)初創(chuàng)模型企業(yè)缺乏商業(yè)化能力,下游80%部署AI的企業(yè)尚未實現(xiàn)凈利潤提升。

換句話說,源源不斷地投錢,卻沒有在商業(yè)收入上高效轉化。

判斷AI是否處于泡沫,不能僅憑市場熱度,而需從估值水平、盈利支撐、產業(yè)邏輯三個核心維度理性分析。

從估值來看,當前美國科技巨頭的估值并未達到歷史泡沫峰值。

被稱為“美股七姐妹” 的核心科技股當前市盈率約31倍,遠低于2000年互聯(lián)網(wǎng)泡沫時期的極端水平。

更重要的是,這些企業(yè)大多具備強勁的現(xiàn)金流和造血能力,與當年缺乏盈利支撐的互聯(lián)網(wǎng)初創(chuàng)企業(yè)有本質區(qū)別。

從產業(yè)邏輯來看,美國AI硬件投資自2023年已增長2000-3000億美元,數(shù)據(jù)中心、算力基礎設施的建設雖然存在局部過熱跡象,但背后是真實的產業(yè)需求支撐。谷歌TPU芯片對外供貨引發(fā)的“鲇魚效應”,更證明AI產業(yè)正從壟斷走向多元共生。

關于部分企業(yè)“閉環(huán)買賣”的模式——英偉達投資xAI后xAI隨即采購其芯片,微軟投資OpenAI后獲得巨額云服務訂單——可能導致估值虛高,進而帶來局部泡沫,尤其是美國前十大科技股占全球股市近25%的極高集中度,也讓市場波動的傳導風險不容忽視。

但市場不是從來就是二八分化,優(yōu)勢資源集中在20%的機構手里?

從我們的視角來看,所謂AI泡沫:只是短期利益與長期價值、資本狂歡與技術本質的博弈。

即便是真有泡沫,擠掉就是。

文丨傅里葉的貓 海軍

編輯丨蘇揚 史蓓蓓

主編|成書麗

監(jiān)制|付天喜