推理時代異構架構崛起(Cerebras IPO、Trainium規模化)直接挑戰NVDA單一GPU假說;Apple硬體接班人Ternus確認以裝置差異化為核心路徑
5 層觀察
- 能源德州Hill County通過數據中心暫停令,社區反對擴散至民主黨與共和黨執政州,電網阻力作為電力擴張硬瓶頸的證據增強
- 晶片Cerebras IPO定價上調至$150-160、Trainium推理份額擴大、Intel Xeon需求反彈,三條並行數據共同壓縮NVDA GPU在推理市場的主導假說
- 基礎設施OpenAI與AWS達成Bedrock Managed Agents協議、微軟Azure獨家條款終止,雲端基礎設施競爭格局從Azure獨佔轉向多雲,AWS推理定位強化
- AI 模型Anthropic宣布Q1年化營收成長80倍並與xAI Colossus簽300MW算力合約,企業工作流護城河假說獲具體需求數據支撐
- 應用Tim Cook退位、Ternus接班聚焦硬體執行,Apple AI應用層路徑確認依賴裝置週期而非模型突破,Siri滯後與智慧家庭延遲為反向壓力
關連腦圖
支持論點
1.晶片異構推理架構崛起直接挑戰NVDA單一GPU主導假說
2.能源社區反對使電力基建擴張阻力成為可量化的監管風險
德州Hill County通過一年暫停令、Gallup調查顯示70%美國人反對本地數據中心建設(48%強烈反對),此數據將電力基建瓶頸假說的時間軸風險從技術層面(電網互聯積壓)延伸至政治層面,2026下半年北美新增容量受限假說獲額外佐證。
3.基礎設施AWS多雲化瓦解Azure獨家優勢,雲端基礎設施競爭重組
4.AI 模型Anthropic企業編碼護城河獲80倍營收成長數據強化
為什麼重要
NVDA需重新評估推理市場ASIC替代率邊界——若Cerebras、Trainium、TPU三路在推理份額合計超過20%並在連續兩季財報中體現,NVDA推理軟體護城河假說正式進入破功條件。AAPL須追蹤Ternus能否在2026 iPhone 18週期內兌現on-device AI差異化換機潮,Siri滯後與智慧家庭延遲是當前最大反向訊號。GOOGL與AMZN的雲端基礎設施市場份額消長在多雲格局確立後成為季報核心追蹤指標,Google Cloud backlog $460B對應的TPU需求是否轉化為TSMC N3產能競爭亦需監控。INTC Xeon需求反彈獲Intel Q2指引$13.8-14.8B確認,CPU作為AI推理協調層的結構性回歸對INTC估值重置具直接意義。
第一性原理
推理workload的計算需求結構與訓練根本不同:訓練要求全對全GPU互聯(NVDA NVLink優勢),推理要求低延遲吐吐量與成本最佳化(ASIC/CPU更具競爭力)。當agentic推理取代人在循環的即時查詢,速度不再是首要指標,成本與專用性成為定價決定因子——此轉移使Cerebras(速度)與Trainium(成本)在不同細分市場各具結構性優勢。量化邊界:AWS Trainium實例相較H100在推理成本上具30-40%折讓(依Jassy法說會引述),若此價差維持,企業採購決策將加速ASIC滲透。電力層面,Gallup 70%反對率疊加Hill County暫停令代表北美土地與電網互聯審批週期將延長12-24個月,直接限制2027年前新增數據中心容量,受益者是已取得電力許可的既有園區運營商而非新進入者。
投資方向
| 方向 | Ticker / rationale |
|---|---|
| 多 Long | AMZN — AWS多雲化獲OpenAI背書、Trainium推理成本優勢、Q1成長28%三重數據支撐;對應infra多雲競爭重組viewpoint |
GOOGL — Cloud backlog從$240B暴增至$460B、TPU需求驅動、企業agentic平台規模化;對應infra viewpoint中Google整合優勢假說 | |
INTC — CPU作為AI推理協調層結構性回歸,Q2指引$13.8-14.8B超預期;對應chip layer異構架構崛起viewpoint | |
TSMC — TSMC 2026全年營收指引上調至>30%成長、N2/N3需求由Rubin與Apple M系列支撐;對應chip supply假說 | |
| 空 Short | NVDA — 推理市場ASIC三路並進(Cerebras/Trainium/TPU),若推理份額>20%持續2季,軟體護城河假說破;對應nvidia-multi-arch-moat-vs-asic viewpoint空方條件 |
| 觀察 Watch | AAPL — Ternus接班聚焦硬體,iPhone 18 on-device AI換機潮假說2026年為驗證視窗;Siri滯後為當前主要風險 |
ARM — 自製晶片策略進展與TSMC N2產能分配結果將在2025下半年顯現,決定arm-ip-licensing viewpoint h-002是否觸發 | |
MSFT — Azure獨家優勢終止後,Azure市占率變化與Copilot 2000萬付費用戶成長速度為觀察重點 |
相關公司 KB 快照
AMZN3 個 KB 文件
根據 Howard KB 內 AMZN 相關文件摘要,亞馬遜正積極佈局視覺模型技術,參與 Mamba 系列比較研究,凸顯其在 AI 模型架構創新上的技術野心,同時透過 AWS 提供算力支撐學術與產業合作。在競爭態勢上,亞馬遜面臨 Meta、Google、NVIDIA 等巨頭在基礎模型領域的強力挑戰,且與 Flipkart、Walmart 等電商平台存在直接競爭。風險方面,外部政策干預(如中國防疫隔離措施調整)可能影響供應鏈穩定;催化因素則來自於 GRPO 等強化學習技術的進展,以及 DeepMath 等垂直應用模型的商用潛力,有望強化其雲端與零售生態的 AI 競爭力。
- /volume1/homes/howard/MS/AI/mamba/Mamba系列視覺模型之深入技術比較.docx
- /volume1/homes/howard/MS/文件/WeChat Files/wxid_0096230961722/FileStorage/File/2022-06/广东省新冠肺炎防控指挥办疫情防控组关于调整集中隔离管理措施的紧急通知(1)(1).pdf
- /volume1/homes/howard/Google/學測/英文/指考英文試卷.pdf
GOOGL3 個 KB 文件
Google 在AI技術定位上,持續強化終端與雲端運算的雙軌佈局,其LiteRT與TPU分別鞏固行動裝置與資料中心的邊緣推理及高效能訓練能力,並與Android NNAPI形成垂直整合的軟硬體生態。競爭態勢方面,面臨NVIDIA Ampere與AMD MI300在雲端訓練市場的強勢追趕,以及高通Snapdragon Gen2與蘋果神經引擎在終端AI的擠壓。風險在於晶圓代工成本與先進封裝供應鏈的依賴,催化劑則來自Gemma開源模型與Flux等生成式AI框架擴大生態系,以及與華為等業者的5G專利交叉授權緩解地緣衝突壓力。
- /volume1/homes/howard/MS/20230918-万联证券-电子行业周观点:华为与小米达成全球专利交叉许可协议,覆盖包括5G在内通信技术.pdf
- /volume1/homes/howard/MS/S19系列经营关键指标-charter_1692942480283653 - 複本.pptx
- /volume1/homes/howard/MS/Y&SE成本模拟2.0_1017_1666149506213203 - 複本 - 複本.xlsx
INTC3 個 KB 文件
Intel正面臨技術定位與競爭態勢的關鍵轉折。在先進製程上,其18A製程正面對標台積電N2的GAA技術,並在伺服器與PC領域與AMD及ARM架構處理器競爭,而華為麒麟晶片回歸也加劇了國產替代壓力。風險層面,需關注新質生產力政策下的競爭加劇,以及其代工業務能否成功扭轉頹勢;催化劑則包括18A量產進度、晶片法案補助落地,以及能否在AI和邊緣運算領域取得突破性設計贏單。
- /volume1/homes/howard/MS/20230918-招商证券-全球产业趋势跟踪周报:工信部出台政策响应培育“新质生产力”号召.pdf
- /volume1/homes/howard/MS/20230918-招商证券-电子行业华为手机产业链跟踪报告:华为新机携麒麟芯片回归,关注产业链技术创新及国产替代 1.pdf
- /volume1/homes/howard/MS/2023年3月经营例会-待确认实销份额输出方式-0316_159155299_.pptx
TSMC3 個 KB 文件
台積電在先進製程的技術定位上已穩居產業領導者,專注於N3P 3奈米及N2 2奈米奈米片(GAA)製程的開發,為客戶提供高效能與雙NPU優化的晶片方案。競爭態勢方面,面對英特爾18A製程的追趕,以及聯發科、高通等IC設計大廠的供應鏈動態,台積電需持續鞏固其在高端智慧型手機與AI晶片的關鍵地位。主要風險包括華為Mate60 Pro的麒麟晶片回歸可能引發市場重新佈局,帶來的地緣政治與供應鏈調整壓力;催化因素則在於其N2製程順利量產,有望成為帶動營運新成長的關鍵動能。
- /volume1/homes/howard/MS/20230917-中泰证券-半导体行业周报:华为Mate60 Pro加单,看好产业链投资机遇.pdf
- /volume1/homes/howard/MS/20230918-招商证券-电子行业华为手机产业链跟踪报告:华为新机携麒麟芯片回归,关注产业链技术创新及国产替代 1.pdf
- /volume1/homes/howard/MS/23Q3路标风险与策略_0831_1693516896585032 - 複本.pptx
NVDA3 個 KB 文件
NVIDIA 持續以 H100 等高效能 GPU 主導 AI 訓練與推理市場,技術上深度整合 Transformer、FlashAttention 與 3nm 製程,並透過 NVCell 等自動化設計工具鞏固其軟硬體生態。然而,高通 Snapdragon 8 Gen3、谷歌 TPU 及華為 Mate 60 Pro 的崛起,加上 3nm 製程的競爭與地緣政治風險,正威脅其市占。催化劑來自其對 MIT、清華等學研機構的早期投資,以及自駕與邊緣 AI 的新應用場景,這些將是下一階段成長的關鍵。
- /volume1/homes/howard/MS/20230918-光大证券-计算机行业AI主题演绎复盘&下阶段展望:华为Mate 60 Pro持续引领关注,建议关注华为产业链相关标的.pdf
- /volume1/homes/howard/MS/MTK Fin report.xlsx
- /volume1/homes/howard/MS/S17 B端动作.pptx
AAPL3 個 KB 文件
在技術定位上,Apple 正面臨華為麒麟晶片回歸帶來的強勁挑戰,後者重返高階市場將壓縮 iPhone 的競爭優勢與潛在份額。同時,高通、三星及 OV 米等對手持續進逼,使整體競爭態勢更為激烈。風險方面,華為全聯接大會可能揭示新的 AI 與生態戰略,進一步加劇對 Apple 生態系統的壓力;但催化劑在於 Apple 能否藉晶片技術迭代及服務生態突破來穩固高階品牌地位,並抓住國產替代趨勢下的供應鏈調整契機。
- /volume1/homes/howard/MS/20230918-招商证券-电子行业华为手机产业链跟踪报告:华为新机携麒麟芯片回归,关注产业链技术创新及国产替代.pdf
- /volume1/homes/howard/MS/20230918-华西证券-计算机行业报告:华为全联接大会前瞻,智能的下一站.pdf
- /volume1/homes/howard/MS/20230921-中信建投-华勤技术-603296-全域客户覆盖份额持续提升,2+N+3平台布局动能充足.pdf
ARM3 個 KB 文件
根據 Howard KB 內的 ARM 相關文件摘要,ARM 技術定位持續向高效能運算與先進製程推進,如 Cortex-X925 核心與 Mali-G1 Ultra 架構,並與聯發科 Dimensity 9400/9500 及高通 Adreno 830/840 在 TSMC N3E/N3P 製程上激烈競爭。市場競爭態勢由 MTK、高通及多家終端品牌(如 vivo、DJI)主導,而 ARM 與 TI、立錡科技等供應鏈深度綁定。風險層面需關注 8Gen6/7 及 E5 系列晶片的路標延遲,催化劑則來自華為 Mate60 Pro 加單帶動的產業鏈需求,以及高效能核心(如 C1-Ultra)在行動與邊緣運算領域的滲透。
- /volume1/homes/howard/MS/20230917-中泰证券-半导体行业周报:华为Mate60 Pro加单,看好产业链投资机遇.pdf
- /volume1/homes/howard/MS/23Q3竞争V0 - 屏幕成本_1666144819955139 - 複本.pptx
- /volume1/homes/howard/MS/23Q3路标风险与策略_0831_1693516896585032 - 複本.pptx
MSFT3 個 KB 文件
微軟正以 Kinect 感測器與 Azure 雲端 AI 能力,卡位邊緣運算與電腦視覺領域,技術上與 Qualcomm、NVIDIA 的 GPU 晶片及 Apple、Google 的生態競爭,同時面臨華為 Kirin 9000 與螞蟻集團等中國廠商的本土化威脅。潛在催化劑來自對 CNN、Mask R-CNN 等深度學習架構的整合,以及 LIDAR 感測數據處理的突破,但需注意中美科技脫鉤與供應鏈風險,以及 LeCun 等學派對其演算法路線的挑戰。
- /volume1/homes/howard/MS/合肥出差报告_1208.docx
- /volume1/homes/howard/MS/(新)附件2 个人承诺书(示范文本) - 複本.docx
- /volume1/homes/howard/MS/Howard Proflie 2023.docx