AI 新聞與投資

2026-04-15 briefing

AGI 備戰:算力軍備競賽的真實代價與隱藏矛盾

規模本身已成為信仰

Satya Nadella 帶著記者參觀 Fairwater 2 的時候,說的是「每 18 到 24 個月訓練容量提升十倍」。這不是產品發布會的誇飾語言,而是真實的建設節奏:單棟 Fairwater 建築就已超越目前世界上任何一座 AI 資料中心,整個園區規劃超過 2 GW 的總容量。同一時間,xAI 的 Colossus 2 正在邁向全球首座 Gigawatt 級資料中心,OpenAI、Meta、Anthropic 也在同步推進類似規模的建設。12 這個規模競賽有一個奇特的性質:沒有人能夠確定終點在哪裡,但每個參與者都無法停下來。資本支出的爆炸不是因為有人計算過 ROI 然後決定投入,而是因為不投入就等於退出比賽。Nadella 在訪談中被追問 CAPEX 爆炸的問題,他給的答案本質上是:這是基礎設施,就像當年的電網。這個類比聽起來合理,但電網建設的時候人們知道用電的需求在哪裡。現在沒有人真正知道 AGI 的需求曲線長什麼樣子。1 更值得注意的是,這波建設潮發生在 GB200 NVL72 的軟體堆疊尚未成熟的時候。SemiAnalysis 的數據顯示,目前沒有任何一個前沿實驗室或雲端服務商成功在 GB200 NVL72 上完成大規模訓練,真正在用的仍然是 H100、H200 和 Google TPU。但 Fairwater 2 裡裝的是數十萬顆 GB200 和 GB300。換句話說,微軟正在用一個還沒有被驗證能跑完整訓練的架構,建造號稱世界最強的資料中心。31 這不必然是壞決策,新架構需要時間成熟,提前佈建是合理的賭注。但它說明了一件事:在這個競賽裡,建設速度已經超過了驗證速度。

硬體升值打破了所有人的財務模型

H100 的租用價格在 2024 年底觸底之後,從 2025 年 12 月開始大幅反彈,目前的市值已經超過三年前剛推出時的水準。Dylan Patel 在訪談中直接說 H100 現在比三年前更值錢,這個說法被租用市場的數據所支持。45 這個現象本身就很奇怪。一般的半導體邏輯是:新架構推出之後,舊架構折舊加速,因為效能差距明顯。GB200 的 FP4 算力是 H100 的好幾倍,按照正常的汰換邏輯,H100 應該繼續貶值。但它沒有。原因是多重的:推理模型和 Agent 工作負載的爆炸性增長讓算力供給整體不足;更好的推理軟體讓舊晶片跑出了更高的利用率;加上全球晶片短缺的大背景,使得任何可用的算力都有溢價。4 這對資料中心的商業模型有根本性的影響。過去資料中心 TCO 計算的前提是:晶片四到七年內折舊完畢,收入要在這個週期內回本。現在如果晶片不折舊、甚至升值,整個財務模型都要重寫。但這個升值能持續多久,沒有人知道。它依賴於需求持續超過供給,而供給端正在被 Fairwater、Colossus 2 這類建設計畫以驚人速度擴充。12 SemiAnalysis 對 H100 和 GB200 NVL72 的 TCO 分析揭示了另一層複雜性:可靠性問題。GB200 的故障率和停機時間仍在改善中,而停機損失直接吃掉效能優勢。H100 的生態系統已經成熟,工程師知道怎麼用,軟體棧穩定。這意味著在實際的每訓練 token 成本上,四年老架構有時候仍然勝過最新架構。硬體升值和可靠性溢價加在一起,讓舊晶片的商業生命週期遠比預期的長。35

RL 的資訊效率問題被嚴重低估

AI 圈對 RL 的信心在過去一年大幅提升,主要原因是 o1、o3、DeepSeek R1 等推理模型展示了通過 RL 訓練獲得的能力躍升。但這個信心可能建立在一個不完整的計算框架上。通常大家討論的是:RL 的 FLOP 效率遠低於監督學習,因為需要展開一整條思考軌跡才能獲得一個獎勵信號。然而這只是問題的一半。6 更少被討論的是每個樣本的資訊密度問題。在預訓練的監督學習中,每個 token 都帶有關於語言結構、世界知識的信號,模型從每個 token 都能學到東西。在 RL 中,當模型的通過率很低的時候,絕大多數的軌跡都是錯的,而錯誤的軌跡帶來的信號極其稀薄。用 Bits/FLOP = Samples/FLOP × Bits/Sample 這個框架來看,兩個因子同時都很差:樣本效率低,每個樣本的資訊量也低。這意味著在模型還不夠強的早期訓練階段,RL 的真實效率可能比人們以為的低一到兩個數量級。6 這個問題與 xAI 正在嘗試的獨特 RL 方法形成了有趣的對照。SemiAnalysis 的報告提到 xAI 的 RL 方法論有其特殊之處,可能讓他們在這個面向上取得優勢。但細節未公開,我們無法評估。2 如果 Dwarkesh 的分析是對的,那麼當前 RL 擴展的瓶頸不只是算力,也是訓練信號的品質問題。投入再多 GB200 也無法解決一個根本性的樣本效率問題。微軟建的 Fairwater、xAI 建的 Colossus 都是在賭 RL 可以繼續擴展,但這個賭注的基礎比表面上看起來更脆弱。資料中心的規模競賽和 RL 的資訊效率問題是同一個故事的兩面:前者假設算力是瓶頸,後者指出算力可能根本不是最緊的約束。61

供應鏈的脆弱性沒有被算進去

HBM 是 AI 算力擴展最被低估的瓶頸之一。所有前沿加速器都依賴 HBM,而 HBM 的供應商高度集中在 SK Hynix、三星、Micron 三家。SemiAnalysis 的分析指出,HBM 的供給瓶頸在短期內難以快速緩解,因為製造工藝複雜,良率提升需要時間。即使 TSMC 的邏輯製程產能充足,缺少 HBM 就無法完成高端 GPU 的組裝。7 Huawei 的崛起為這個格局增添了另一層複雜性。美國的出口管制把 Nvidia 的高端晶片擋在中國市場之外,但這同時推動了華為 Ascend 的快速量產。SemiAnalysis 的報告指出,HBM 是華為 Ascend 擴產的真正瓶頸,而不是邏輯晶片本身。中國目前無法自製足夠品質的 HBM,這使得 Ascend 的產能受制於能買到多少西方 HBM。8 這個供應鏈脆弱性在 Dylan Patel 對三大算力瓶頸的分析中有更系統性的呈現:邏輯製程、記憶體、電力三個維度各有各的約束,而且時間軸不同。他的判斷是,ASML 會在 2030 年成為 AI 算力擴展的第一瓶頸,因為 EUV 光刻機的產能直接限制了先進製程晶圓廠的擴產速度。5 把這些放在一起看,Fairwater 2 的 2 GW 宏大敘事背後,有一條非常具體的供應鏈依賴鏈:GB200/GB300 需要大量 HBM4,HBM4 需要 SK Hynix 的新製程,新製程需要 ASML 的 High-NA EUV 設備,ASML 的設備產能有物理上限。任何一個環節卡住,整個建設計畫都會推遲。Nadella 在訪談中把 CAPEX 支出描述為對未來的信心,但信心不能替代供應鏈的實際交貨能力。7851

從規模擴張到研究突破:AI 下一階段的真實困境

預訓練的天花板與「硬烤技能」的矛盾

Ilya Sutskever 說得直接:我們正在從規模擴張的時代走向研究的時代。這句話聽起來像是樂觀宣言,但背後其實是一個未解的工程難題。當前主流做法是在大型語言模型之上堆疊強化學習,再透過「中訓練」把特定技能硬塞進模型——教它怎麼用瀏覽器、怎麼操作 Excel、怎麼跑金融模型。整條供應鏈都在服務這件事。問題是這個邏輯有個內建的自我矛盾:如果我們真的快要得到人類等級的學習者,這套精心設計的技能烘焙流程完全是白費功夫;如果這套流程還有必要,那就代表 AGI 根本沒有想像中那麼近。9

這個矛盾在機器人領域最為赤裸。機器人問題在根本上是演算法問題,不是硬體或資料問題。人類幾乎不需要訓練就能遙控現有硬體完成有用的工作。但事實是,今天的機器人仍然需要跑遍上千個家庭、蒐集大量示範資料,才能學會收盤子或疊衣服。這個現象恰好說明一件事:我們根本還沒有一個像樣的通用學習者。9 SemiAnalysis 的機器人自主等級分析也印證了這點——現有系統的商業可行性完全繫於可靠性與執行精度,而不是泛化能力的突破。10

Beren Millidge 的觀察讓這個問題更加尖銳:我們在基準測試上看到的進步,有相當大比例來自於花費大量資金讓博士、醫師等領域專家設計高品質問題和範本答案。這本質上是專家系統時代的再演——只不過過去是直接把專家邏輯寫成程式碼,現在是透過行為複製把它蒸餾進模型。11 把這件事說清楚是重要的,因為它直接挑戰了「我們已經接近 AGI」的敘事:一個真正的 AGI 不應該需要這種規模的人工鷹架。

大腦的秘密是獎勵函數,不是架構

Adam Marblestone 提出了一個從神經科學角度切入的關鍵論點:大腦學習的優勢不在於其架構本身,而在於基因組如何編碼抽象的獎勵函數。這個問題和 Ilya 長期追問的問題——「基因組怎麼把獎勵函數存進去的?」——其實是同一個問題。這不是巧合,這是當前 AI 研究的核心缺口。12

今天的模型在訓練分布內表現驚人,但泛化能力依然令人失望。原因很可能正是在這裡:現有的 RL 訓練框架依賴可驗證的結果作為獎勵信號,這對於有明確答案的任務(程式碼、數學證明)效果不錯,但對於需要真正世界模型與因果推理的任務就力不從心了。Marblestone 的立場是,AI 領域目前對大腦的理解是片面的——研究者們把注意力放在架構(Transformer 大致對應大腦皮層的某些計算模式),卻忽略了大腦如何用少量經驗完成快速泛化的根本機制。12

這和 Dario Amodei 的看法形成有趣的對比。Amodei 承認「指數的尾端」快要到了,但他對持續學習是否為必要條件仍然持開放態度。他的立場是:即使當前方法有侷限,模型的進步曲線大致符合預期,且這個軌跡已足夠接近「資料中心裡的一個天才國度」。13 但問題在於,Amodei 的樂觀是針對當前任務分布的外推,而 Marblestone 的批評是針對學習機制本身的缺失。兩者說的不是同一件事,但很多討論把它們混在一起。一個模型可以在 PhD 等級的考題上表現出色,同時在它從未見過的學習場景下完全失敗——這兩件事並不矛盾。

自動化 AI 研究員的循環論證

「短時間線」陣營有一個常見的反駁:我們現在做這些笨拙的 RL 訓練,目的是建造超人類 AI 研究員,然後讓一百萬個自動化 Ilya 去解決真正的泛化問題。這個論證的邏輯結構很像那個古老的商業笑話:「我們每筆交易都在虧錢,但靠量來補。」你要求一個連小孩都不如的學習者,在自主完成整個研究循環的同時,去解決人類花了幾十年都沒解決的演算法問題。11

Import AI 追蹤的 PostTrainBench 結果提供了一個數字錨點:目前表現最好的 AI 代理(Opus 4.6 on Claude Code)在自動微調任務上拿到 23.2%,而人類研究員的同等成績是 51.1%。差距在縮小,進步速度也確實比大多數人預期的快——Ajeya Cotra 坦承她對 2026 年軟體工程能力的預測已經太保守。1415 但「比預期快」和「足以完成遞迴自我改進」之間仍然是兩個不同的命題。

Jack Clark 在 Control Inversion 的討論框架裡提出了一個更根本的問題:當 AI 系統夠強的時候,它不會賦予人類更多權力,而是會從人類身上吸走權力。這個論點的基礎是速度差距的不可通約性——如果系統以人類無法即時跟進的速度運作,所謂的「人類監督」就只是名義上的控制。16 把這個觀察和「百萬自動化研究員」的敘事放在一起,就會出現一個讓人不安的組合:即使這套計畫在技術上奏效,它所創造的系統也會快速超出任何有意義的人類驗證範圍。MIT 和 UCLA 的研究者提出的「中空經濟」風險也指向同一個方向:代理的產出在名義上看起來很好,但它實際上是否在滿足真實意圖,沒有人能快速驗證。17

能力快速增長與結構性問題並存的弔詭

從表面上看,當前的 AI 能力進展是真實的,不是幻覺。Numina-Lean-Agent 解決了 Putnam 2025 的所有題目,MirrorCode 顯示 Opus 4.6 可以對一個有一萬六千行程式碼的生物資訊工具做逆向工程,網路安全研究發現攻擊性能力的提升週期已縮短到五點七個月。181920 這些結果是可測量的,不是行銷說詞。

但這裡有一個跨文章才看得到的 pattern:所有快速進步的領域都有一個共同特徵,就是任務本身具有可驗證的輸出——定理證明、程式碼執行、漏洞利用成功與否。這和「硬烤技能」的問題是同一枚硬幣的兩面:在有明確評估標準的地方,RL 加規模的組合確實有效;在沒有明確評估標準的地方,這套方法就陷入困境。Marc Andreessen 說這次不一樣,因為代理和遞迴自我改進讓 AI 終於從實驗室跑進現實世界,21 這個觀察本身沒有錯,但它迴避了一個更難的問題:現實世界的大多數有價值任務恰好屬於那種難以驗證的類型。

Ben Thompson 在 2026 年 3 月宣布他不再認為我們在泡沫裡,理由是代理從根本上改變了計算需求的形狀和誰會使用它。22 這可能是正確的市場判斷。但市場不泡沫化和底層技術問題已解決是兩件事。大量資本可以在基礎學習機制的問題還沒解決的情況下,繼續流向有明確 ROI 的垂直應用。Damodaran 的框架很有用:AI 的故事一直由它的倡議者和銷售員來敘述,現在市場開始問的問題——投資什麼時候回收、以什麼形式回收——和研究社群問的問題根本不同。23 前者是財務問題,後者是科學問題,兩者的時間尺度可以完全脫節很長一段時間。

企業該不該持有比特幣?一個比投資判斷更根本的治理問題

問題不在比特幣,在於誰來決策

Damodaran 反對多數企業持有比特幣,理由不是他不看好比特幣,而是他不信任企業管理層有能力做好擇時。這個立場值得仔細拆解。比特幣只能被「定價」而無法被「估值」,它沒有現金流、沒有盈利模型,價格完全是市場情緒的函數。既然如此,押注比特幣等同於押注自己能比市場更早看到情緒轉向。這種能力在機構投資人中都屬稀缺,遑論一家軟體公司或製造業的財務長。MicroStrategy 的成功被廣泛引用,但倖存者偏差在這裡幾乎是透明的——沒人去算那些默默虧損或因此陷入流動性危機的公司。更根本的問題是:企業持有現金,是因為資本市場有摩擦,在需要資金時無法以合理成本即時融資,所以必須保留緩衝。把這個緩衝換成波動率極高的資產,在最需要現金的時刻(景氣下行、信用緊縮),很可能正好是比特幣價格最低的時刻,屆時的流動性壓力將比原本更嚴峻。這不是在討論比特幣的長期報酬是否為正,而是在討論企業資產負債表的功能定位根本與此不符。2425

替代資產的銷售話術與現實落差

比特幣進入企業資產負債表,背後隱含的邏輯與替代資產整體的銷售話術高度重疊:低相關性帶來分散效益、有機會創造超額報酬。Damodaran 在分析替代性投資時直接點破,這套話術在機構層面已取得廣泛認同,但實際帶來的淨效益「最好的情況是有限,最糟的情況是負的」。問題出在哪裡?相關性在市場壓力時會顯著上升,分散效益在最需要它的時刻消失;而所謂的超額報酬,扣掉手續費、流動性折價與資訊不對稱之後,往往所剩無幾。黃金與比特幣都被歸類為「收藏品」(collectibles),它們的共同點是沒有內在現金流,定價純粹依賴下一個買家願意付多少。這類資產加入投資組合,能否真的改善風險報酬邊界,取決於非常嚴苛的條件,包括正確的進出場時機、充分的市場深度、以及對波動率的承受能力。對個人投資者而言,這已經是高難度的判斷;對一家需要向股東解釋資產配置的上市公司來說,標準更高,問責的機制卻往往更模糊。在這個脈絡下,企業持有比特幣的決策,其實是把一個個人投資哲學問題,強行嫁接到一個有受託責任的法人結構上。2627

主權信用惡化與比特幣敘事的共同根源

2025年的市場有一條隱藏的敘事主線:對傳統機構的信任正在侵蝕。Moody's 下調美國主權評級,是三大評級機構中最後一個放棄Aaa的,此前S&P在2011年、Fitch在2023年已相繼跟進。這不只是信用評分的技術調整,而是對美國財政軌跡與政治功能的結構性判斷。與此同時,美元走弱、黃金大漲、比特幣也在同一年受到關注。Damodaran 將這個現象命名為「信任赤字」(trust deficit):當政府、央行、監管機構的可信度受到質疑,資金會流向那些「不依賴任何機構承諾」的資產。黃金的邏輯如此,比特幣的邏輯亦然。從這個角度看,企業持有比特幣的衝動,與其說是投資判斷,不如說是對主權貨幣體系的不信任投票。這個敘事在情感上有說服力,但在資產負債表管理上並不成立。一家企業的現金部位,本質上是為了應對營運風險,不是為了對沖主權風險。如果管理層真的相信美元的購買力將長期崩解,正確的應對是調整定價策略、供應鏈結構與融資幣別,而非把流動資金押注在一個波動率是黃金數倍的資產上。信任崩解的宏觀敘事,被當作微觀財務決策的理由,這是邏輯層次的混淆。282524

唯一說得通的案例:護城河本就不在現金

Damodaran 並未完全否定所有公司持有比特幣的可能性,他指出存在一個「小子集」的公司,這個策略在特定條件下是合理的。這個子集的特徵是:核心業務本身就與加密生態系高度相關,持有比特幣是業務邏輯的延伸而非財務操作;同時必須有充分的資訊揭露與治理機制作為護欄。這個例外的存在,反過來更清楚地劃出了邊界。對絕大多數上市公司而言,現金的功能是提供營運韌性,它的對立面是高波動性資產。從債務與資本結構的角度看,槓桿本身已經放大了企業的財務風險,在這個基礎上再持有高波動資產,等於在風險維度上雙重加碼。更值得注意的是,Michael Burry的13F申報顯示他的倉位持續集中在少數幾個具體的基本面押注,而非任何加密或替代資產敞口——這位以逆向思維著稱的投資人,在比特幣企業化浪潮最熱的時期,選擇的是沉默而非跟進。對企業管理層來說,比特幣策略最大的吸引力,或許正是它最大的危險:它讓財務決策看起來像是有遠見的戰略宣示,但實際上只是在用股東的錢做一個無法對沖的方向性賭注。242930

Epic Systems:一家被刻意設計成無法被資本市場消化的公司

Epic 是基礎設施,不是軟體

大多數人透過 MyChart 認識 Epic,把它當成一個預約門診的 App。這個理解是錯的,而且錯得很徹底。Epic 實際上是美國醫療體系的作業系統——從病患互動、帳務、排班、處方到研究,幾乎所有醫院流程都跑在它上面。超過 90% 的美國醫學院畢業生在學期間就被訓練使用 Epic,這意味著 Epic 的護城河不是合約鎖定,而是人才管線的預先佔據。這種設計讓 Epic 更接近 TSMC 的邏輯:你不是在跟一家公司做生意,你是在依賴一個你根本無法繞過的節點。TSMC 的晶圓製造能力讓全球半導體產業別無選擇;Epic 的訓練滲透率讓美國醫療體系別無選擇。兩者都不是靠市場行銷贏的,都是靠成為基礎設施贏的。3132

但 Epic 和 TSMC 有一個關鍵差異:TSMC 的護城河是資本密集與製程複雜度,有人想挑戰還得先砸幾千億美金。Epic 的護城河更接近網絡效應加上行政慣性——一旦一家醫院的所有流程、所有人員都在 Epic 上,換掉它的成本不只是技術成本,而是整個組織要重新學習如何運作。這種黏性不是 Epic 透過綁約強制的,而是醫療體系自己選擇的,因為沒有人想在 ICU 切換系統。軟體吃掉世界的說法沒錯,但 Epic 吃掉的那塊比其他任何 SaaS 公司都更難消化掉。3133

Judy Faulkner 把「不能賣」設計進公司結構

Judy Faulkner 做了一件在商業史上極罕見的事:她用法律手段確保 Epic 永遠不能被收購、不能上市、不能再收購其他公司。這不是隨便說說的願景聲明,而是被刻進公司結構的硬性約束。從資本市場的角度看,這是個異類;從策略的角度看,這是個天才決策。

大多數科技公司的終局是 IPO 或被收購。上市之後,季報壓力會把長期決策一刀一刀切掉;被收購之後,整合需求會把原本的文化和產品邏輯稀釋掉。Epic 把這兩條路都封死,等於是在說:我們只需要對醫院和病患負責,不需要對股東負責。這讓 Epic 可以做出普通上市公司根本不敢做的決定,包括在 Verona 農場蓋世界最大的地下劇場,蓋霍格華茲和翡翠城的仿製品,以及花幾十年打磨一個沒有競爭對手敢接手的複雜產品。

Acquired 的節目花了大量篇幅記錄 Epic 的這個結構選擇,而這個選擇的反面教材其實遍地都是:多少 SaaS 公司在上市後為了維持成長曲線而做出讓核心產品變差的決定?多少公司在被大廠收購後慢慢消失?Faulkner 的答案是:不玩這個遊戲。她最可能是史上最富有的白手起家女性,但她選擇的致富路徑是讓公司永遠不被資本市場定價。3134

AI 衝擊醫療軟體的時間軸比想像中慢

當 Anthropic 的 Claude Mythos 被描述為能夠「找到每個主要作業系統和瀏覽器中的高危漏洞」,當 OpenAI 的 Frontier 團隊在用 0% 人工撰寫的程式碼跑超過百萬行的程式庫,有一個自然而然的問題:Epic 會不會被 AI 顛覆?3536

短期答案是不會,理由不是 Epic 的技術特別好,而是醫療監管的時間軸和 AI 的迭代速度根本不在同一個量級。一個新的醫療軟體要取代 Epic,需要的不只是更好的程式碼,而是通過 FDA 相關審查、說服醫院 IT 部門、重新訓練數十萬名醫護人員,以及說服醫療院所承擔在系統切換期間可能發生的病患安全風險。這些障礙不是技術問題,是制度問題。AI 可以加速程式碼生成,但沒辦法加速衛生部的審核流程。

更根本的問題在於:誰來承擔切換風險?一家醫院的 CIO 如果決定把核心系統從 Epic 換成某個 AI 原生的新創公司,而這個切換過程中出了任何問題,職涯就結束了。這種不對稱的懲罰結構讓現有玩家的護城河比任何技術分析所顯示的都要深。Nvidia 的 Jensen Huang 在 GTC 2026 強調 AI 基礎設施的加速運算邏輯,但他說的是資料中心,不是醫院病房。醫療體系的 AI 採用曲線會是所有行業裡最平緩的那條。35363731

「不上市」本身就是一種競爭策略

Ben Thompson 在分析 Microsoft 把 Anthropic 的 Claude 納入 Copilot 時,指出了一個核心邏輯:大公司試圖把 AI 模型商品化(commoditize the complement),以便在自己控制的層次上保持差異化。38 這個框架放到 Epic 身上會產生一個有趣的推論:Epic 最大的競爭優勢之一,恰好是它的商業結構讓它無法被任何大公司用這個策略對付。

Google、Microsoft、Amazon 都想切入醫療 AI,而且都有足夠的資本可以收購競爭對手。但他們買不了 Epic,因為 Epic 不賣。這不只是 Judy Faulkner 的個人意志,而是被寫進法律結構的事實。當 Anthropic 面對計算資源短缺而需要依賴 Google 的 TPU39,當 OpenAI 在收購 TBPN 這類周邊資產來鞏固敘事40,這些公司都在某種程度上依賴外部資本和策略夥伴關係來維持運營。Epic 不需要這些。它的收入來自醫院合約,它的成長來自醫療體系本身的擴張,它不需要對任何外部投資人解釋下一季的成長計劃。

這讓 Epic 成為 AI 時代最難被顛覆的軟體公司之一,不是因為它的技術最先進,而是因為它的結構設計讓所有慣常的顛覆路徑都失效。收購不行,因為不賣;競爭不行,因為訓練滲透太深;等待它犯錯不行,因為沒有股東壓力迫使它走捷徑。這是一家被刻意設計成無法被資本市場消化的公司。31383940

TSMC 的壟斷邏輯:為何晶圓代工是 AI 時代最被低估的槓桿

TSMC 的護城河不是技術,是時間

Morris Chang 在 1987 年創辦 TSMC 時已經 56 歲,半導體業界普遍認為他在德州儀器的黃金年代已經過去。事實證明那個判斷完全錯了。TSMC 的護城河從來不是某一個單點技術突破,而是數十年不間斷的資本投入所堆疊出來的製程領先優勢。這個優勢的本質是時間,而時間是無法用錢直接購買的。41

這一點在 AI 基礎設施的脈絡下變得格外清晰。Dwarkesh Patel 的分析指出,Nvidia 光是 2025 年一年的獲利,就足以支付 TSMC 過去三年的全部資本支出。更令人震驚的是,Nvidia 僅使用 TSMC 約 20% 的產能,卻產生了 1000 億美元的盈利。換句話說,TSMC 的每一分投資,在 Nvidia 的商業模式下被放大了不止一個數量級。42

然而這個放大效應並不意味著 TSMC 拿走了多數的經濟剩餘,恰恰相反。TSMC 扮演的是整個 AI 硬體供應鏈最關鍵、也最難被替代的那個環節,但其定價能力始終受到客戶集中度和地緣政治壓力的雙重限制。Arm 最新推出的自家 CPU 晶片,同樣由 TSMC 製造,這個選擇本身就說明了一件事:在先進製程領域,繞過 TSMC 根本不是一個選項。43

真正的問題不是 TSMC 能否保持技術領先,而是整個生態系對單一供應商的依賴是否已經超過了任何人願意承認的程度。Apple、Nvidia、Broadcom、Qualcomm、AMD,現在連 Intel 都在這裡流片。當所有人都押注在同一個地方,這個地方的地緣政治風險就不再只是台灣的問題,而是全球科技業的系統性風險。

垂直整合的誘惑:從 Apple 到 Arm 都在走同一條路

Apple 的 50 年歷史本質上是一部垂直整合史。從最早的 Apple II 到 M 系列晶片,Apple 反覆證明一件事:當硬體與軟體的整合點掌握在自己手裡,你就擁有競爭對手無法輕易複製的成本結構和效能優勢。MacBook Neo 搭載 A18 Pro 手機處理器售價 599 美元,比前代最低階 MacBook Air 便宜 500 美元,這不是行銷策略,這是製程和架構的垂直整合紅利直接反映在定價上。TSMC 的計費邏輯是按晶圓面積收費,更小的晶片意味著更多良率更高的 die,成本自然下降。44

Arm 選擇在這個時間點宣布自己要賣晶片,而不只是授權 IP,背後的邏輯是一樣的。多年來 Arm 一直扮演「中立平台」的角色,讓 Apple、Nvidia、高通等公司都在自己的架構上設計晶片。現在 Arm 決定親自下場,製造針對 AI 資料中心「編排層」優化的 CPU,同樣交給 TSMC 生產。43 這是一個明確的訊號:在 AI 時代,光靠授權 IP 的利潤空間不夠,你必須更靠近價值鏈的核心。

但垂直整合有其內在矛盾。Google 的案例說明了這一點。Google Brain、Transformer 架構、TPU——這些都是 Google 自己建立的,比任何競爭對手都早。他們甚至僱用了幾乎所有頂尖的 AI 人才。然而 ChatGPT 推出時,Google 還是被打了個措手不及。技術上的垂直整合優勢,在組織慣性和商業模式保護面前,並沒有發揮應有的作用。45 垂直整合保護你不受外部競爭者攻擊,但無法保護你不受自己的商業模式束縛。

TSMC 的案例是垂直整合邏輯的另一面。它選擇不整合——不設計晶片,不販售終端產品,只做製造。這個「刻意不整合」的決策,讓所有想要最先進製程的人都必須來找它,反而創造了一種更深層的市場控制力。Morris Chang 當年把這個模式叫做「純粹晶圓代工」,在 1987 年是一個沒人看好的賭注,現在是整個科技業的基礎設施。41

AI 軍備競賽的真正瓶頸不在模型,在晶圓

所有關於 AI 競賽的討論都聚焦在模型能力、訓練資料、人才搶奪。Meta 用兩億美元四年期合約搶人,Zuckerberg 親自出馬,某些研究員收到了十億美元的報價仍然拒絕。46 Oracle 的資本支出在單季就達到 186 億美元,遠超分析師預期,手持訂單積壓達到 5530 億美元。47 AWS 正在以有史以來最快的速度建設資料中心,核心錨定客戶是 Anthropic。48

但如果你順著供應鏈往上游走,最終都會到達同一個地方:TSMC 的晶圓廠。Dwarkesh Patel 的分析讓這個問題變得很具體:ASML、應用材料、東京威力科創等五大半導體設備公司,過去 25 年的研發加資本支出加總,還不及 Nvidia 一年的營收。這個比例失衡到令人難以置信的程度,以至於文章直接用「fab capex overhang」這個詞來形容——晶圓廠的投資規模相對於下游需求,是嚴重供給不足的。42

這裡有一個沒有人直說的矛盾:AI 公司都在喊算力不夠,但 TSMC 的擴產速度受限於設備供應商的產能,而設備供應商的投資規模在歷史上根本沒有預期過這個量級的需求。ASML 的 EUV 機台每台造價超過一億美元,從下單到交貨需要一到兩年,整個供應鏈是以十年為週期在規劃的,不是以季度。

Arm CEO Rene Haas 在訪談中直接提到,供應鏈已經處於接近上限的狀態,這是 Arm 進入自有晶片市場面臨的真實風險之一。49 換句話說,不只是 Arm,所有人都在搶同一條產線。這也是為什麼 Nvidia 是否會直接補貼新製程節點的問題,已經不再是天方夜談——Dwarkesh 的計算顯示,Nvidia 在財務上完全有能力這樣做。42 當下游需求大到可以反向補貼上游基礎設施,整個產業的權力結構就已經悄悄發生了根本性的改變。TSMC 仍然是中心,但圍繞它的引力場,正在被 AI 資本的重力重新塑造。

地緣政治是 TSMC 的宿命,也是它的保護傘

TSMC 的地緣政治風險是一個被討論得極其頻繁、但結論永遠含糊的話題。大家都知道台灣海峽的緊張關係意味著什麼,但沒有人能夠承擔放棄 TSMC 的代價,所以最終的政策回應通常是:在美國、日本、歐洲各蓋一座廠,然後假裝這解決了問題。

這個邏輯有幾個根本性的漏洞。第一,TSMC 在台灣的製程領先整整兩個世代。美國廠(Arizona)生產的是 4nm,台灣已經量產 2nm 並在推進 1.6nm。「在地化生產」解決的是政治焦慮,不是技術依賴。第二,半導體製造需要一個極其密集的供應鏈生態系,包括特殊化學品、精密設備、工程師訓練,這些東西幾十年來都集中在台灣,不是用蓋廠就能複製的。41

從 AI 國家安全的角度來看,這個問題更複雜。Gregory Allen 在訪談中提到,晶片出口管制是美中 AI 競爭的核心戰場之一,但管制措施的設計非常困難——管太嚴,中國加速自主研發;管太鬆,先進算力直接流向潛在對手。50 這個兩難並不是新問題,但在 AI 時代,晶片的戰略價值被放大到前所未有的程度,所以每一個決策的代價也被同比放大。

更深層的矛盾在於:美國政府需要 TSMC 的晶片來維持 AI 領先,同時擔心 TSMC 的地理位置是戰略脆弱點,但又無力在短期內建立真正能夠取代的本土產能。這個三角關係沒有乾淨的出口。TSMC 的管理層非常清楚這一點,這也是為什麼他們在全球政治博弈中始終保持一種非常精準的曖昧——足夠配合美國的安全要求,但從未真正讓任何一方覺得自己完全掌控了局面。Morris Chang 在 1987 年建立的那個「純粹代工、不競爭客戶」的中立原則,到了 2025 年已經演變成一種地緣政治上的生存藝術。4150

Footnotes

  1. Satya Nadella — How Microsoft is preparing for AGI — Dwarkesh Podcast 2 3 4 5 6

  2. xAI’s Colossus 2 – First Gigawatt Datacenter In The World, Unique RL Methodology, Capital Raise — SemiAnalysis (Dylan Patel) 2 3

  3. H100 vs GB200 NVL72 Training Benchmarks – Power, TCO, and Reliability Analysis, Software Improvement Over Time — SemiAnalysis (Dylan Patel) 2

  4. AINews H100 prices are melting UP — Latent Space (swyx) 2

  5. Dylan Patel — Deep dive on the 3 big bottlenecks to scaling AI compute — Dwarkesh Podcast 2 3 4

  6. RL is even more information inefficient than you thought — Dwarkesh Podcast 2 3

  7. Scaling the Memory Wall: The Rise and Roadmap of HBM — SemiAnalysis (Dylan Patel) 2

  8. Huawei Ascend Production Ramp: Die Banks, TSMC Continued Production, HBM is The Bottleneck — SemiAnalysis (Dylan Patel) 2

  9. Thoughts on AI progress (Dec 2025) — Dwarkesh Podcast 2

  10. Robotics Levels of Autonomy — SemiAnalysis (Dylan Patel)

  11. Thoughts on AI progress (Dec 2025) — Dwarkesh Podcast 2

  12. Adam Marblestone — AI is missing something fundamental about the brain — Dwarkesh Podcast 2

  13. Dario Amodei — "We are near the end of the exponential" — Dwarkesh Podcast

  14. ImportAI 449: LLMs training other LLMs; 72B distributed training run; computer vision is harder than generative text — Import AI (Jack Clark)

  15. Import AI 448: AI R&D; Bytedance's CUDA-writing agent; on-device satellite AI — Import AI (Jack Clark)

  16. Import AI 435: 100k training runs; AI systems absorb human power; intelligence per watt — Import AI (Jack Clark)

  17. Import AI 447: The AGI economy; testing AIs with generated games; and agent ecologies — Import AI (Jack Clark)

  18. Import AI 442: Winners and losers in the AI economy; math proof automation; and industrialization of cyber espionage — Import AI (Jack Clark)

  19. Import AI 453: Breaking AI agents; MirrorCode; and ten views on gradual disempowerment — Import AI (Jack Clark)

  20. Import AI 452: Scaling laws for cyberwar; rising tides of AI automation; and a puzzle over gDP forecasting — Import AI (Jack Clark)

  21. Marc Andreessen on AI Winters and Agent Breakthroughs — a16z Podcast

  22. Agents Over Bubbles — Stratechery by Ben Thompson

  23. AI Scenarios: From Doomsday Destruction to Do-Nothing Bots! — Musings on Markets (Aswath Damodaran)

  24. To Bitcoin or not to Bitcoin? A Corporate Cash Question! — Musings on Markets (Aswath Damodaran) 2 3

  25. Data Update 3 for 2026: The Trust Deficit - Bonds, Currencies, Gold and Bitcoin! — Musings on Markets (Aswath Damodaran) 2

  26. The (Uncertain) Payoff from Alternative Investments: Many a slip between the cup and the lip? — Musings on Markets (Aswath Damodaran)

  27. Finding your investing lodestar: In Search of an Investment Philosophy — Musings on Markets (Aswath Damodaran)

  28. Sovereign Ratings, Default Risk and Markets: The Moody's Downgrade Aftermath! — Musings on Markets (Aswath Damodaran)

  29. Data Update 7 for 2026: Debt and Taxes — Musings on Markets (Aswath Damodaran)

  30. 13F-HR - Quarterly report filed by institutional managers, Holdings — SEC EDGAR Scion Asset Management 13F

  31. Epic Systems (MyChart) — Acquired FM 2 3 4 5

  32. TSMC Founder Morris Chang — Acquired FM

  33. Did We Overeat on Software? — a16z Future

  34. 10 Years of Acquired (with Michael Lewis) — Acquired FM

  35. AINews Anthropic @ $30B ARR, Project GlassWing and Claude Mythos Preview — first model too dangerous to release since GPT-2 — Latent Space (swyx) 2

  36. Extreme Harness Engineering for Token Billionaires: 1M LOC, 1B toks/day, 0% human code, 0% human review — Ryan Lopopolo, OpenAI Frontier & Symphony — Latent Space (swyx) 2

  37. An Interview with Nvidia CEO Jensen Huang About Accelerated Computing — Stratechery by Ben Thompson

  38. Copilot Cowork, Anthropic's Integration, Microsoft's New Bundle — Stratechery by Ben Thompson 2

  39. Anthropic's New TPU Deal, Anthropic's Computing Crunch, The Anthropic-Google Alliance — Stratechery by Ben Thompson 2

  40. OpenAI Buys TBPN, Tech and the Token Tsunami — Stratechery by Ben Thompson 2

  41. TSMC (Remastered) — Acquired FM 2 3 4

  42. Thoughts on the AI buildout — Dwarkesh Podcast 2 3

  43. Arm Launches Own CPU, Arm's Motivation, Constraints and Systems — Stratechery by Ben Thompson 2

  44. MacBook Neo, The (Not-So) Thin MacBook, Apple and Memory — Stratechery by Ben Thompson

  45. Google Part III: The AI Company — Acquired FM

  46. Meta Superintelligence – Leadership Compute, Talent, and Data — SemiAnalysis (Dylan Patel)

  47. Oracle Earnings, Oracle's Cloud Growth, Oracle's Software Defense — Stratechery by Ben Thompson

  48. Amazon’s AI Resurgence: AWS & Anthropic’s Multi-Gigawatt Trainium Expansion — SemiAnalysis (Dylan Patel)

  49. An Interview with Arm CEO Rene Haas About Selling Chips — Stratechery by Ben Thompson

  50. An Interview with Gregory Allen About Anthropic and the U.S. Government — Stratechery by Ben Thompson 2