消息指出蘋果私有雲算力多達 90% 算力閒置,新版 Siri 可能大量依賴 Google Gemini 提供生成式 AI 能力。
蘋果在生成式AI的追趕之路上,似乎正面臨嚴峻的內部基礎建設陣痛期。根據The Information網站取得消息,由於Apple Intelligence的實際使用率不如預期,加上內部研發團隊的技術架構嚴重碎片化,蘋果為其「私有雲端運算」 (Private Cloud Compute, PCC)準備的AI伺服器算力,實際上有高達90%處於閒置狀態。而為了解決眼前的燃眉之急,蘋果先前已經確定擴大與Google合作,將直接引入Gemini技術強化今年即將登場的新版Siri。
內部山頭林立:90%私有雲伺服器算力閒置
根據報導披露數據,蘋果為支援Apple Intelligence雲端運算所儲備的硬體算力中,實際佈署到資料中心的比例僅約10%,剩餘約90%的AI伺服器目前仍處於閒置狀態。
造成這種資源嚴重浪費的深層原因,在於蘋果內部AI基礎設施的「嚴重碎片化」。其中,蘋果不同的AI研發團隊處於各自為戰的狀態,使用著截然不同的技術堆疊,遲遲未能建立起一套統一且高效率的伺服器技術架構。
這種各自為政的研發模式,不僅拖垮了整體開發效率,更因為基礎設施的重複建設,引發了嚴重的成本超支問題。
短期妥協:攜手Google以Gemini技術驅動新版Siri
面對內部基礎設施的瓶頸,以及市場對於AI應用的迫切渴望,蘋果選擇務實的短期妥協方案:全面加深與Google合作,將Gemini模型作為升級Siri的核心引擎。
今年的重大改版:蘋果預計在今年推出經過重大重構的Siri。這個新版本將由一個擁有高達1.2兆參數規模的客製化Gemini AI模型 (蘋果內部代號為Foundation Models v10)提供算力支援,全面提升Siri的理解與對話能力。
明年iOS 27的獨立聊天機器人:著眼未來,蘋果計畫在明年的iOS 27更新中,推出一款更強大的獨立Siri聊天機器人。該系統雖然所有權歸屬於蘋果,但底層將運行於Google的TPU與雲端基礎設施之上,並且搭載預期效能可媲美「Gemini 3」的更先進客製化模型 (Foundation Models v11)。
長期戰略:代號「Baltra」自研AI伺服器晶片
儘管短期內必須仰賴Google的火力支援,但蘋果顯然不打算將雲端AI的命脈長期交給競爭對手。
為了從根本上扭轉受制於人的局面,蘋果正傾全力推進一項代號為「Baltra」的自研AI伺服器專用晶片 (ASIC)。這款晶片預計將採用以下前瞻規格:
• 強強聯手:與網通晶片大廠博通 (Broadcom)展開深度合作設計。
• 先進製程:採用台積電目前最頂級的3nm「N3E」製程製造。
• 小晶片架構 (Chiplet): 透過在單一封裝內整合不同的功能模組,Chiplet設計不僅能大幅優化晶片內部的通訊效率,更便於蘋果向合作夥伴嚴格保密其整體的晶片架構設計細節。
分析觀點
從這則爆料可以看出蘋果在AI戰略上的雙軌操作:「前端體驗靠結盟,後端基建靠自研」。
高達90%的私有雲算力閒置,確實暴露了蘋果在雲端軟體與伺服器架構管理上的短板。但蘋果的高明之處在於,他們願意放下身段,在體驗可能落後的空窗期,直接引入目前業界頂尖的Google Gemini技術來為Siri「續命」,確保數以億計的iPhone用戶在今年就能享受到一流水準的AI語音助理體驗,而不會因為蘋果內部的技術陣痛期而流失。
與此同時,代號Baltra的自研晶片計畫才是蘋果真正的殺手鐧。一旦這款基於台積電3nm製程與Chiplet 架構的伺服器晶片研發到位,蘋果將能把過去在Apple Silicon (M系列晶片)上累積的能耗比優勢,完美複製到資料中心。屆時,蘋果不僅能徹底擺脫對Google雲端的依賴,更能再次收攏軟硬體整合的絕對控制權。


