算力軍備競賽：貝佐斯 vs 馬斯克的 AI 基礎建設

✍️ 整理：蔡依橙

上一篇〈太空雙雄〉講貝佐斯與馬斯克在月球上的較量。但這兩個人的戰場不只在天上，地面上還有一條同樣燒錢的戰線：AI 算力。誰能蓋出更多、更便宜的運算能力，誰就掌握下一個十年 AI 的命脈。

自己設計晶片，真的比買 NVIDIA 便宜嗎？

近兩年 AI 晶片最缺、也最貴，這個市場幾乎被 NVIDIA 一家獨佔。但雲端巨頭自己做晶片，其實不是被 NVIDIA 逼出來的臨時反應，而是醞釀多年的佈局：Google 早在 2015 年就在內部使用自研的 TPU（2016 年才公開），Amazon 也在 2015 年收購晶片公司 Annapurna Labs，之後陸續推出 Graviton、Inferentia、Trainium 等自研晶片，如今都已大量使用。問題在於：設計一顆晶片的前期成本是天文數字（幾億到十幾億美元），自己做真的比直接買 NVIDIA 划算嗎？

答案是：規模夠大才划算，而且省的不只是錢。分三層看：

1. 省下 NVIDIA 的高額價差

NVIDIA 的毛利率高達約 75%（2025 會計年度全年 GAAP 毛利率 75.0%），意思是你付的錢裡有一大半是它的利潤。像 Amazon 這種一年要買幾百億美元晶片的買家，與其把這筆利潤送給 NVIDIA，不如自己設計、找台積電代工。前期設計成本很高，但攤到幾百萬顆上面，每顆就便宜了。這就是「規模化降成本」，也是最主要的動機。規模不夠大的公司自研一定虧，但 Amazon、Google 大到跨過了那條線。

2. 為自己的工作量身設計

NVIDIA 的晶片要賣給全世界、什麼都得能做，很多功能對「只想跑自家 AI」的 Amazon 是浪費。自研晶片可以砍掉用不到的部分、針對自家模型最佳化，同樣的電做更多事，而電費是資料中心最大的開銷之一。

3. 不被別人掐住脖子

過去兩年 NVIDIA 晶片嚴重缺貨，誰能拿到貨、拿多少，NVIDIA 說了算。自己有晶片，就不必排隊、不怕被中斷供貨、不被漲價綁架。對把「賣算力」當核心生意的 Amazon 來說，供應自主幾乎是戰略級的事。養出一整批懂晶片設計的團隊，這個能力本身就是長期的護城河。

晶片代工的真相：最後全繞回台積電

有趣的是，這些雲端巨頭「自研」的晶片，自己並不會製造。它們設計，台積電製造。

以 Amazon 的 Trainium 晶片為例：架構由 Amazon 旗下的 Annapurna Labs 設計，最新的 Trainium3 由台積電以 3 奈米製程製造，是目前最先進的製程等級之一，跟 NVIDIA 最新晶片同級。也就是說，這些自研晶片用的不是落後製程，而是和 NVIDIA 最新晶片同級、最尖端的製程。

而且現在四大雲端（Amazon、Google、Microsoft、Meta）的自研晶片，最後全部都拿到台積電投片。這也帶出一個矛盾：大家都想搶先進製程，但 3 奈米和先進封裝全面供不應求。NVIDIA 一家就吃下先進封裝（CoWoS）產能的最大一塊，其他自研晶片業者只能搶剩下的。所以「自研就能不受制於人」這句話只對了一半，晶片設計可以自主，但製造和封裝這關，全世界還是一起卡在台積電的產能上。

佈滿一格格晶片的矽晶圓 — 一片矽晶圓上佈滿一格格的晶片，要先經過台積電的先進製程與封裝才能成形。不管是誰設計的晶片，最後都繞回這片晶圓。圖：Peellden, CC BY-SA 3.0

晶片小知識

幾個名詞對照（台灣用語）

製程：晶片上電路的精細程度，數字越小越先進（3 奈米比 5 奈米先進）。微影／曝光：用光把電路圖案「印」到晶圓上的關鍵步驟。封裝（CoWoS）：把多顆晶片組裝在一起、接好線路的後段工序，現在 AI 晶片搶的就是這道產能。

馬斯克也在蓋算力，但跟 Amazon 做的是兩種生意

講到地面算力，馬斯克一點都不缺席，而且規模驚人。他的 xAI 在田納西州 Memphis 蓋的 Colossus 超級電腦，已擴到 2 GW、約 55.5 萬顆 NVIDIA GPU、投資約 180 億美元，是全球最大的單一基地 AI 訓練設施，還喊出要衝到 100 萬顆。

但這裡有個常被搞混的差別：馬斯克和 Amazon 做的其實是兩種不同的生意。

Amazon

把算力當產品賣

AWS 二十年的雲端老本行，蓋算力就是為了出租給全世界，這是它的核心商業模式。賣算力本身就是賺錢的事業。

馬斯克 / xAI

為自己蓋，順手賣掉多的

蓋 Colossus 主因是給自家 xAI 訓練 Grok 用，不是要當雲端房東。把吃不完的產能賣掉，是「順手變現」，不是核心生意。

所以「馬斯克真的在做 AI 基礎建設嗎」的精準答案是：他在瘋狂蓋算力（為自己用），順手把多的賣掉；Amazon 才是把算力本身當產品賣的那一個。兩人都在這場軍備競賽的前段班，但角色不同。

馬斯克簽一張約，就回本了嗎？

馬斯克「順手賣掉」的那一筆，其實很大。2026 年 5 月，Anthropic 包下整座 Colossus 1 的產出（300 MW），每月付給 xAI 12.5 億美元、一路付到 2029 年 5 月，整筆總額超過 400 億美元。SpaceX 那邊也直說，這是在「把閒置的運算產能變現」。

不過，這筆錢有兩件事要算進去：分攤的時間，還有要扣掉的成本。

那 400 億是整個合約期，不是一年

算一下：每月 12.5 億 × 約 36 個月（到 2029 年 5 月）≈ 450 億美元的總額，所以一年大約是 150 億，不是 400 億。而且這還要扣掉三筆很重的成本。

要回本，得減掉：

建置成本：那座更大的 Colossus 2 光 GPU 就花了約 180 億美元；Anthropic 租的 Colossus 1 規模較小，但也是數十億等級的投資。
電費與營運：跑 300 MW 是「持續燒電」，一年電費就是數十億美元等級，xAI 甚至自己架發電機供電。
GPU 折舊極快：AI 晶片大概 3 到 4 年就被新一代淘汰，等於這批硬體在合約期內就快貶到底。

把帳算完整：這張合約對「Colossus 1 這一塊」來說，三年下來確實能把那塊的建置成本賺回來、還有得賺，是門好生意。但它不是「一張約一年就全部回收」，而是「三年累積約 450 億、扣掉巨額電費與硬體折舊後仍很賺」。而且馬斯克沒打算停手，他把賺到的錢全砸進「衝到 100 萬顆 GPU」的更大擴張，是滾雪球而不是收割。

Anthropic 的四路佈局：不把雞蛋放一個籃子

順帶看買方這邊。租 xAI 算力的 Anthropic（Claude 的母公司），其實同時跟四家簽了大約，誰也不依賴：

Anthropic 的四路算力來源

同時押四家，分散風險、保留議價空間。

① Amazon AWS（自家 Trainium 晶片）

規模

最高 5 GW，目前已用超過百萬顆 Trainium2

合約

十年、逾 1,000 億美元，主力訓練平台

② Google（TPU 晶片）

規模

數 GW 級

合約

約 2,000 億美元、五年期，Google 同時投資 Anthropic

③ Microsoft Azure + NVIDIA

規模

含額外 1 GW

合約

300 億美元 Azure 容量，NVIDIA、微軟分別投資 100 億、50 億美元

④ xAI Colossus 1（這次的主角）

規模

300 MW，整座 Colossus 1 的產出

合約

每月 12.5 億、付到 2029/5，總額逾 400 億美元

四路並進的意義很清楚：沒有把命脈交給任何一家。同時有四個強大來源，跟 xAI 議價時的姿態自然從容。這也呼應馬斯克在這筆交易裡其實比較急，他有閒置產能要變現，而 Anthropic 手上有的是選擇。

結語：地面打完，戰場要上太空

把這條戰線總結一下：Amazon 穩，是把算力當生意、自研晶片壓成本的老手；馬斯克猛，瘋狂蓋算力給自己用、順手把多的變現。而所有人的晶片，最後都繞回台積電那道供不應求的產能。

但地面上的電、水、土地都是有限的，AI 算力越蓋越大，瓶頸越來越緊。於是有人開始想一個更大膽的點子：把資料中心整個搬上太空。聽起來像科幻，卻已經有人在認真做、甚至送衛星上去實測了。下一篇〈把東西丟上低軌道〉，我們就來看這個瘋狂點子到底可不可行。

自己設計晶片，真的比買 NVIDIA 便宜嗎？

1. 省下 NVIDIA 的高額價差

2. 為自己的工作量身設計

3. 不被別人掐住脖子

晶片代工的真相：最後全繞回台積電

馬斯克也在蓋算力，但跟 Amazon 做的是兩種生意

馬斯克簽一張約，就回本了嗎？

Anthropic 的四路佈局：不把雞蛋放一個籃子

結語：地面打完，戰場要上太空

你可能也想看