上一篇〈太空雙雄〉講貝佐斯與馬斯克在月球上的較量。但這兩個人的戰場不只在天上,地面上還有一條同樣燒錢的戰線:AI 算力。誰能蓋出更多、更便宜的運算能力,誰就掌握下一個十年 AI 的命脈。

自己設計晶片,真的比買 NVIDIA 便宜嗎?

近兩年 AI 晶片最缺、也最貴,這個市場幾乎被 NVIDIA 一家獨佔。但雲端巨頭自己做晶片,其實不是被 NVIDIA 逼出來的臨時反應,而是醞釀多年的佈局:Google 早在 2015 年就在內部使用自研的 TPU(2016 年才公開),Amazon 也在 2015 年收購晶片公司 Annapurna Labs,之後陸續推出 Graviton、Inferentia、Trainium 等自研晶片,如今都已大量使用。問題在於:設計一顆晶片的前期成本是天文數字(幾億到十幾億美元),自己做真的比直接買 NVIDIA 划算嗎?

答案是:規模夠大才划算,而且省的不只是錢。分三層看:

1. 省下 NVIDIA 的高額價差

NVIDIA 的毛利率高達約 75%(2025 會計年度全年 GAAP 毛利率 75.0%),意思是你付的錢裡有一大半是它的利潤。像 Amazon 這種一年要買幾百億美元晶片的買家,與其把這筆利潤送給 NVIDIA,不如自己設計、找台積電代工。前期設計成本很高,但攤到幾百萬顆上面,每顆就便宜了。這就是「規模化降成本」,也是最主要的動機。規模不夠大的公司自研一定虧,但 Amazon、Google 大到跨過了那條線。

2. 為自己的工作量身設計

NVIDIA 的晶片要賣給全世界、什麼都得能做,很多功能對「只想跑自家 AI」的 Amazon 是浪費。自研晶片可以砍掉用不到的部分、針對自家模型最佳化,同樣的電做更多事,而電費是資料中心最大的開銷之一。

3. 不被別人掐住脖子

過去兩年 NVIDIA 晶片嚴重缺貨,誰能拿到貨、拿多少,NVIDIA 說了算。自己有晶片,就不必排隊、不怕被中斷供貨、不被漲價綁架。對把「賣算力」當核心生意的 Amazon 來說,供應自主幾乎是戰略級的事。養出一整批懂晶片設計的團隊,這個能力本身就是長期的護城河。

晶片代工的真相:最後全繞回台積電

有趣的是,這些雲端巨頭「自研」的晶片,自己並不會製造。它們設計,台積電製造。

以 Amazon 的 Trainium 晶片為例:架構由 Amazon 旗下的 Annapurna Labs 設計,最新的 Trainium3 由台積電以 3 奈米製程製造,是目前最先進的製程等級之一,跟 NVIDIA 最新晶片同級。也就是說,這些自研晶片用的不是落後製程,而是和 NVIDIA 最新晶片同級、最尖端的製程。

而且現在四大雲端(Amazon、Google、Microsoft、Meta)的自研晶片,最後全部都拿到台積電投片。這也帶出一個矛盾:大家都想搶先進製程,但 3 奈米和先進封裝全面供不應求。NVIDIA 一家就吃下先進封裝(CoWoS)產能的最大一塊,其他自研晶片業者只能搶剩下的。所以「自研就能不受制於人」這句話只對了一半,晶片設計可以自主,但製造和封裝這關,全世界還是一起卡在台積電的產能上。

佈滿一格格晶片的矽晶圓
一片矽晶圓上佈滿一格格的晶片,要先經過台積電的先進製程與封裝才能成形。不管是誰設計的晶片,最後都繞回這片晶圓。圖:Peellden, CC BY-SA 3.0
晶片小知識
幾個名詞對照(台灣用語)

製程:晶片上電路的精細程度,數字越小越先進(3 奈米比 5 奈米先進)。微影/曝光:用光把電路圖案「印」到晶圓上的關鍵步驟。封裝(CoWoS):把多顆晶片組裝在一起、接好線路的後段工序,現在 AI 晶片搶的就是這道產能。

馬斯克也在蓋算力,但跟 Amazon 做的是兩種生意

講到地面算力,馬斯克一點都不缺席,而且規模驚人。他的 xAI 在田納西州 Memphis 蓋的 Colossus 超級電腦,已擴到 2 GW、約 55.5 萬顆 NVIDIA GPU、投資約 180 億美元,是全球最大的單一基地 AI 訓練設施,還喊出要衝到 100 萬顆。

但這裡有個常被搞混的差別:馬斯克和 Amazon 做的其實是兩種不同的生意。

Amazon
把算力當產品賣
AWS 二十年的雲端老本行,蓋算力就是為了出租給全世界,這是它的核心商業模式。賣算力本身就是賺錢的事業。
馬斯克 / xAI
為自己蓋,順手賣掉多的
蓋 Colossus 主因是給自家 xAI 訓練 Grok 用,不是要當雲端房東。把吃不完的產能賣掉,是「順手變現」,不是核心生意。

所以「馬斯克真的在做 AI 基礎建設嗎」的精準答案是:他在瘋狂蓋算力(為自己用),順手把多的賣掉;Amazon 才是把算力本身當產品賣的那一個。兩人都在這場軍備競賽的前段班,但角色不同。

馬斯克簽一張約,就回本了嗎?

馬斯克「順手賣掉」的那一筆,其實很大。2026 年 5 月,Anthropic 包下整座 Colossus 1 的產出(300 MW),每月付給 xAI 12.5 億美元、一路付到 2029 年 5 月,整筆總額超過 400 億美元。SpaceX 那邊也直說,這是在「把閒置的運算產能變現」。

不過,這筆錢有兩件事要算進去:分攤的時間,還有要扣掉的成本。

那 400 億是整個合約期,不是一年

算一下:每月 12.5 億 × 約 36 個月(到 2029 年 5 月)≈ 450 億美元的總額,所以一年大約是 150 億,不是 400 億。而且這還要扣掉三筆很重的成本。

要回本,得減掉:

把帳算完整:這張合約對「Colossus 1 這一塊」來說,三年下來確實能把那塊的建置成本賺回來、還有得賺,是門好生意。但它不是「一張約一年就全部回收」,而是「三年累積約 450 億、扣掉巨額電費與硬體折舊後仍很賺」。而且馬斯克沒打算停手,他把賺到的錢全砸進「衝到 100 萬顆 GPU」的更大擴張,是滾雪球而不是收割。

Anthropic 的四路佈局:不把雞蛋放一個籃子

順帶看買方這邊。租 xAI 算力的 Anthropic(Claude 的母公司),其實同時跟四家簽了大約,誰也不依賴:

Anthropic 的四路算力來源
同時押四家,分散風險、保留議價空間。
① Amazon AWS(自家 Trainium 晶片)
規模
最高 5 GW,目前已用超過百萬顆 Trainium2
合約
十年、逾 1,000 億美元,主力訓練平台
② Google(TPU 晶片)
規模
數 GW 級
合約
約 2,000 億美元、五年期,Google 同時投資 Anthropic
③ Microsoft Azure + NVIDIA
規模
含額外 1 GW
合約
300 億美元 Azure 容量,NVIDIA、微軟分別投資 100 億、50 億美元
④ xAI Colossus 1(這次的主角)
規模
300 MW,整座 Colossus 1 的產出
合約
每月 12.5 億、付到 2029/5,總額逾 400 億美元

四路並進的意義很清楚:沒有把命脈交給任何一家。同時有四個強大來源,跟 xAI 議價時的姿態自然從容。這也呼應馬斯克在這筆交易裡其實比較急,他有閒置產能要變現,而 Anthropic 手上有的是選擇。

結語:地面打完,戰場要上太空

把這條戰線總結一下:Amazon 穩,是把算力當生意、自研晶片壓成本的老手;馬斯克猛,瘋狂蓋算力給自己用、順手把多的變現。而所有人的晶片,最後都繞回台積電那道供不應求的產能。

但地面上的電、水、土地都是有限的,AI 算力越蓋越大,瓶頸越來越緊。於是有人開始想一個更大膽的點子:把資料中心整個搬上太空。聽起來像科幻,卻已經有人在認真做、甚至送衛星上去實測了。下一篇〈把東西丟上低軌道〉,我們就來看這個瘋狂點子到底可不可行。