隨著谷歌(Google)母公司Alphabet 的TPU(Tensor Processing Unit)業務的持續壯大,加上Google DeepMind 專注AI 研究,投資銀行D.A. Davidson 分析師最新發布的報告稱,如果谷歌TPU業務獨立出來,整體價值可能高達9,000億美元,相較今年稍早估計的7,170億美元大幅提升。
谷歌專為機器學習和AI 工作負載打造的加速器TPU,受到AI 研究人員與工程師的廣泛關注。谷歌第六代Trillium TPU 自2024年12月大規模推出后,需求相當強勁。專為推論設計的第七代Ironwood TPU 在今年Google Cloud Next 25 大會上推出,預期也將獲得客戶大量采用。
從此前公布的信息來看,Ironwood TPU 每顆芯片可提供4,614TFLOPS 的峰值算力,驅動思考型和推論型模型。Ironwood TPU 還大幅增加了高頻寬內存(HBM)容量,每顆芯片提供192GB 容量,是Trillium TPU 的6倍,以處理更大型的模型和數據集運算;同時Ironwood TPU 每顆芯片帶寬可達7.2Tbps ,是Trillium TPU 的4.5倍。不只如此,Ironwood TPU 性能功耗比是Trillium TPU 的2倍,為客戶的AI 工作負載提供每瓦更多的運算能力。
雖然很多小型云端業者依舊偏好英偉達 GPU。 對他們而言,GPU不僅能即刻滿足市場需求,且CUDA生態完整、開發者接受度高,整體成本反而更低。不過,谷歌似乎成功說服了一家總部位于倫敦的小型云端公司 Fluidstack。
據了解, Fluidstack公司主要提供 Nvidia GPU 給 AI 新創企業租用,近期正計劃在紐約興建新數據中心。 據知情人士透露,若Fluidstack無法支付新設數據中心的租金,Google將提供高達32億美元做為“后盾”,藉此換取該公司在數據中心部署TPU。
此外,谷歌也曾嘗試與其他專注英偉達芯片的云服務商達成類似協議,比如正為OpenAI打造一個部署大量英偉達芯片數據中心的Crusoe,以及向微軟和OpenAI租賃英偉達芯片的CoreWeave。
在此之前,谷歌基本不對外出售自研TPU。Capvision此前數據顯示,谷歌TPU此前約70%-80%的算力用于內部業務場景使用,剩余20%-30%以自建租賃方式供外部使用。
至于目前為何谷歌改變心意,開始首次選擇在其他云服務商的數據中心部署TPU,外界認為這可能是谷歌向推動TPU業務獨立,與英偉達進行競爭。
在合作伙伴方面,Alphabet目前僅與博通合作TPU,但傳出與聯發科也在探索合作機會,由聯發科為即將推出的Ironwood TPU提供后端設計服務。與此同時,多家AI 公司加速采用TPU,如Anthropic 開始招聘TPU 核心工程師,可能平衡對AWS Trainium 芯片的依賴,馬斯克(Elon Musk)旗下xAI 受到JAX-TPU 工具改進下,對TPU 展現興趣。
D.A. Davidson 分析師認為Alphabet 在AI 硬件領域的價值未被充分估價,但要將TPU 業務拆分出來,不過在目前的環境不太可能發生,TPU 將會結合Google DeepMind 研究實力繼續融入更多Google 產品組合。