推理時代基礎設施戰場重組:AWS Trainium規模化、Google TPU驅動雲端積壓翻倍、NVIDIA Vera CPU落地,多層競爭格局同步加速
5 層觀察
- 能源數據中心社區反對與電力瓶頸壓力同步升溫,Texas縣級禁建令顯示地方阻力已成真實建廠硬約束
- 晶片NVIDIA Vera CPU首批交付、Intel Xeon AI需求強勁反彈、AWS Trainium推理份額上升,GPU主導地位受多線挑戰
- 基礎設施Google Cloud積壓從$240B暴增至$460B、Azure成長40%、AWS成長28%創2022年來最快,三大超大規模廠商同步加速
- AI 模型OpenAI-AWS Bedrock協議打破Azure獨家,Anthropic企業動能(80x收入成長)推高多雲議價能力,模型層護城河向分發轉移
- 應用企業代理平台進入生產部署階段:Salesforce Agentforce $800M ARR、Microsoft Copilot 160K組織、應用層貨幣化已從pilot轉向規模化
關連腦圖
支持論點
1.晶片AWS Trainium推理規模化直接挑戰NVIDIA GPU推理壟斷假說
AWS Andy Jassy明確指出訓練→推理→代理的需求轉移正使Trainium成為核心受益資產,Ben Thompson分析確認此轉移使AWS在推理時代的ASIC佈局比訓練時代更具競爭力,動搖nvidia-multi-arch-moat-vs-asic的h-002假說中「推理ASIC替代率低於訓練」的核心論點
2.晶片Google Cloud TPU需求驅動積壓翻倍,自製晶片路線獲企業採用驗證
3.能源數據中心地方阻力已固化為AI基礎建設擴張的真實硬約束
Texas Hill County通過縣級建設禁令,Gallup民調顯示70%美國人反對本地建設數據中心,此社會阻力與電網互聯積壓疊加,使ai-energy-power-infrastructure-bottleneck的h-001假說中「2026下半年電力成為主要瓶頸」的時間點獲強化
4.AI 模型OpenAI多雲部署打破Azure獨家,前沿模型護城河向分發層轉移
為什麼重要
NVDA需重新評估推理市場份額防守力:AWS Trainium規模化(4183)與Google TPU積壓翻倍(4182)同步發生,nvidia-multi-arch-moat-vs-asic的h-002假說「推理ASIC替代率低於訓練」正面臨首個大規模反例。GOOGL的Cloud$460B積壓與TPU企業採用數據(4182、4187)確認其基礎設施投資報酬率已轉正,需上調估值中的Cloud乘數。INTC因CPU協調層需求結構性回升(4184)值得重建基本面模型。AAPL在Tim Cook卸任後由John Ternus主導硬體優先策略(4189、4188),on-device AI差異化假說的執行風險需重新定價。MSFT因Azure獨家優勢消失(4185)、OpenAI多雲化衝擊其AI基礎設施護城河,需評估Azure成長40%能否在非獨家環境下維持。
第一性原理
推理工作負載的計算需求結構與訓練根本不同:訓練要求所有GPU同步通信(延遲敏感、頻寬瓶頸),推理代理工作負載可異步分解(延遲容忍、吞吐量優先),這使ASIC在推理場景的性能/成本比首次系統性超越通用GPU。量化層面:Google Cloud積壓在單季從$240B增至$460B(+92%),其中TPU需求是主因之一,若此增速持續一季,代表ASIC路線的企業採用速度遠超nvidia-multi-arch-moat假說中2027年前ASIC份額低於15%的預測邊界。地方阻力與電網互聯積壓構成供給側硬約束,使數據中心擴張的邊際成本非線性上升,受益者是已取得電力許可的既有廠址持有者與電力設備供應商,而非新進建廠者。
投資方向
| 方向 | Ticker / rationale |
|---|---|
| 多 Long | GOOGL — Cloud積壓單季從$240B增至$460B,TPU企業採用驗證ASIC路線可行,基礎設施投資報酬率確認轉正 |
INTC — CPU協調層需求結構性回升,GPU/CPU部署比率回升是可測量的需求驅動,非周期性反彈 | |
AMAT — 數據中心電力與地方阻力硬約束加速既有廠址密度提升需求,設備廠商受益於擴充現有fab而非新建 | |
| 空 Short | MSFT — OpenAI多雲化使Azure獨家護城河消失,模型層護城河轉移假說下Azure成長天花板需下修 |
| 觀察 Watch | NVDA — Trainium規模化與TPU積壓翻倍同步出現,推理ASIC份額假說是否突破15%閾值需下季數據驗證 |
AAPL — Ternus硬體優先策略確立,智慧眼鏡延至2027+、home device延期,on-device AI差異化執行時間軸需重估 | |
ARM — NVIDIA Vera CPU首批交付(4313)壓縮Arm自製晶片的市場窗口,N2/N3產能搶占風險需追蹤 |
相關公司 KB 快照
GOOGL3 個 KB 文件
Google 在 AI 領域的技術定位,以 LiteRT、TPU 及 Android NNAPI 等軟硬體生態,從行動端到雲端運算穩固其競爭優勢。然而,面對 Qualcomm、AMD 及 NVIDIA 在邊緣與資料中心的強勢催油,以及與華為、小米達成專利交叉授權所引發的 5G 標準必要專利策略變化,市場競爭態勢更趨激烈。風險關鍵在於半導體供應鏈(如 TSMC、三星)與自研晶片(如 Gemma、TPU)的成本壓力,催化劑則為新一代 AI 推論架構與多模態模型(如 Flux)的應用落地。
- /volume1/homes/howard/MS/20230918-万联证券-电子行业周观点:华为与小米达成全球专利交叉许可协议,覆盖包括5G在内通信技术.pdf
- /volume1/homes/howard/MS/S19系列经营关键指标-charter_1692942480283653 - 複本.pptx
- /volume1/homes/howard/MS/Y&SE成本模拟2.0_1017_1666149506213203 - 複本 - 複本.xlsx
INTC3 個 KB 文件
Intel正面臨技術定位的關鍵轉折,其18A製程企圖藉由GAA架構追趕台積電N2,以鞏固先進製程競爭力,同時面臨來自AMD與Arm架構的生態威脅。在PC與伺服器領域,Intel Core系列與x86生態仍具主導性,但輝達、聯發科等廠商正加速滲透邊緣與AI運算市場。短期風險在於18A量產時程與良率是否順利,而中國政策推動國產替代可能進一步壓縮Intel市佔;催化劑則來自新質生產力政策對半導體自主化的預期,以及新一代架構能否在2026年前搶回製程話語權。
- /volume1/homes/howard/MS/20230918-招商证券-全球产业趋势跟踪周报:工信部出台政策响应培育“新质生产力”号召.pdf
- /volume1/homes/howard/MS/20230918-招商证券-电子行业华为手机产业链跟踪报告:华为新机携麒麟芯片回归,关注产业链技术创新及国产替代 1.pdf
- /volume1/homes/howard/MS/2023年3月经营例会-待确认实销份额输出方式-0316_159155299_.pptx
AMAT1 個 KB 文件
在半導體設備市場中,應用材料(Applied Materials)專注於環繞閘極(GAA)、SRAM、中段製程(MOL)與後段製程(BEOL)等先進技術,強化材料工程解決方案(MSCOTM)的技術定位。相較於競爭對手,其在關鍵製程節點的整合能力形成差異化優勢,但面臨地緣政治風險及全球設備支出放緩的壓力。未來催化劑來自GAA量產需求與先進封裝擴張,若技術突破順利,可望進一步鞏固其市場主導地位。
- /volume1/homes/howard/MS/20230922-招商证券-招商研究一周回顾.pdf
MSFT3 個 KB 文件
微軟正處於AI與邊緣運算的技術樞紐,其Kinect與CNNs的深度學習整合,強化了在感知與實體運算的定位。面對Qualcomm、NVIDIA等晶片巨頭的競爭,以及Apple、Google的雲端AI追趕,微軟須在自研GPU與演算法上加速突破。風險來自華為Kirin等自主架構的崛起,以及中美供應鏈的脫鉤壓力;催化劑則是與MIT Han Lab合作的感知架構,若能將Mask R-CNN與LIDAR低延遲整合,將在工業元宇宙中取得關鍵領先。
- /volume1/homes/howard/MS/合肥出差报告_1208.docx
- /volume1/homes/howard/MS/(新)附件2 个人承诺书(示范文本) - 複本.docx
- /volume1/homes/howard/MS/Howard Proflie 2023.docx
NVDA3 個 KB 文件
NVIDIA 在 AI 領域持續佔據技術制高點,其 H100 GPU 整合先進的 Transformer 模型與 FlashAttention 架構,單一器件便奠定高效能運算的基礎。然而,競爭態勢正急遽升溫:華為的 3nm 製程及高通 Snapdragon 8 Gen3 的 GPU/NPU 突破,加上谷歌 TPU 與自研晶片蓄勢待發,均對 NVIDIA 的市場主導權構成直接挑戰。關鍵風險在於地緣政治對供應鏈的干擾,以及新興架構(如 NAFNet、MambaNUT)可能顛覆既有軟硬體生態;催化劑則來自 AI 邊緣運算(如 Mobile-ViT)與 EDA 工具(如 NVCell)的加速落地。
- /volume1/homes/howard/MS/20230918-光大证券-计算机行业AI主题演绎复盘&下阶段展望:华为Mate 60 Pro持续引领关注,建议关注华为产业链相关标的.pdf
- /volume1/homes/howard/MS/MTK Fin report.xlsx
- /volume1/homes/howard/MS/S17 B端动作.pptx
AAPL3 個 KB 文件
華為攜麒麟晶片回歸,直接挑戰蘋果在高端市場的技術定位,尤其威脅其A系列與通訊基頻優勢。競爭態勢上,高通等供應鏈夥伴面臨訂單流失壓力,而三星及中國品牌(OPPO、vivo、小米)則加速分食市佔。風險在於華為若突破產能瓶頸,將進一步擠壓蘋果獲利空間,但蘋果若能加速自研晶片迭代與折疊機布局,反而可能觸發新的升級週期催化需求。
- /volume1/homes/howard/MS/20230918-招商证券-电子行业华为手机产业链跟踪报告:华为新机携麒麟芯片回归,关注产业链技术创新及国产替代.pdf
- /volume1/homes/howard/MS/20230918-华西证券-计算机行业报告:华为全联接大会前瞻,智能的下一站.pdf
- /volume1/homes/howard/MS/20230921-中信建投-华勤技术-603296-全域客户覆盖份额持续提升,2+N+3平台布局动能充足.pdf
ARM3 個 KB 文件
根據Howard KB內的ARM相關文件摘要,ARM在技術定位上持續主導手機晶片架構,其高性能核心如Cortex-X925及Mali-G1 Ultra被聯發科與高通採用,並導入台積電N3E/N3P製程,以因應華為Mate60 Pro加單帶來的供應鏈需求。競爭態勢上,聯發科推出Dimensity 9400/9500與C1系列核心,與高通的Adreno 830/840形成對峙,並與vivo、立錡等品牌合作。然而,風險在於先進製程產能受限與TI等IDM廠的競爭壓力,催化劑則來自華為效應與手機市場復甦,將加速ARM生態在行動與邊緣運算領域的滲透。
- /volume1/homes/howard/MS/20230917-中泰证券-半导体行业周报:华为Mate60 Pro加单,看好产业链投资机遇.pdf
- /volume1/homes/howard/MS/23Q3竞争V0 - 屏幕成本_1666144819955139 - 複本.pptx
- /volume1/homes/howard/MS/23Q3路标风险与策略_0831_1693516896585032 - 複本.pptx