最近有消息表明,蘋果正在爲其數據中心設計自己的人工智能芯片。這將爲他們提供一個端到端、雲到邊緣的人工智能系統,這是競爭對手短期內無法匹敵的。

彭博社馬克·古爾曼上周的一篇報道指出,蘋果將在數據中心安裝自己的芯片,幾天後,《華爾街日報》用自己的報道證實了這一點。這一信息最初遭到了高度懷疑,尤其是來自《華爾街日報》的質疑,該報後來改變了對此問題的立場。

許多人表示蘋果“不是一家雲公司”,並且不認爲他們走這條路有什么意義。這讓我們感到很奇怪,因爲我們知道蘋果多年來一直在關注這個問題。在這裏,我們想列出一些我們認爲蘋果想要自己的數據中心芯片的原因。

首先,蘋果正在制造芯片,因爲他們有能力。在領先產能有限的情況下,蘋果是台積電最大的客戶,想必可以獲得他們想要的大部分產能。如果他們確實很好地利用了該芯片,那么現在正是時候。其他人都在爭先恐後,可以想象,蘋果可能會取得很大的領先優勢。

還應該明確的是,蘋果在很大程度上是一家雲服務提供商——他們確實擁有一款名爲 iCloud 的產品。令人困惑的部分原因在於,蘋果公司很少透露其數據中心的用途。他們從來沒有完全清楚地說明如何提供雲服務,這些服務似乎是 Google Cloud、Azure 以及可能還有一些 AWS 的某種組合,但也有他們自己的數據中心。當我們談論“超大規模企業”時,我們默默地假設蘋果是十大數據中心運營商之一。如果所有其他超大規模企業都在設計自己的芯片,那么蘋果也會這樣做。

更微妙的答案是這變得更有趣的地方。長期以來,我們一直在哀嘆生成式人工智能缺乏令人信服的消費者用途,並且我們經常補充說,該行業需要蘋果向其他人展示可以做什么。我們並不相信蘋果實際上已經解決了這個問題,但考慮到下個月的 WWDC 將重點關注人工智能的所有傳言,我們很感興趣。

因此,我們假設蘋果已經推出了一些令人印象深刻的人工智能應用程序,或者至少是蘋果認爲令人印象深刻的應用程序。我們知道他們多年來一直致力於人工智能——從 Siri 語音識別的穩步改進,到照片和視頻圖像的機器學習底層改進,再到 A 系列手機處理器自2018年以來擁有“神經引擎”這一簡單事實。

他們在 ChatGPT 之前就爲 M 系列芯片提供了transformer支持。在這些模型廣泛流行後不久,他們就推出了這種支持,以至於他們似乎已經在這個想法上工作了一段時間了。蘋果擁有一支強大的人工智能團隊。

此外,該團隊似乎已經建立了自己的基礎模型。當然,蘋果擁有其所有關鍵軟件和大量數據(即,他們知道你用手機做什么)。我們不清楚蘋果是如何訓練這個模型的,但我們懷疑他們像其他人一樣使用 Nvidia。

然而,隨着蘋果推出其人工智能應用程序,他們將需要進行大量推理。他們將在設備上運行其中一些(也稱爲“邊緣”,又稱爲消費者爲資本支出和運營支出付費),但他們也會在雲中運行一些推理。

從所有報道來看,尚不完全清楚蘋果將在數據中心使用什么芯片。我們看到有報道稱他們將使用 M2 CPU、M4 CPU 或名爲 ACDC(Apple Chips in Data Center,這將是 2024 年芯片命名競賽中明顯的獲勝者)的全新芯片。無論他們最終使用什么,他們都將受益於連接雲和邊緣推理的通用軟件層。

許多公司都在討論提供此類產品,但蘋果可能是第一個大規模生產這種產品的公司。以這種方式連接所有設備可以節省大量電量,但也可能實現更高程度的隱私,這是該公司的一個重要營銷主題。我們想象宣傳內容會是這樣的:“讓你的手機運行令人驚嘆的人工智能,只有你才能看到你的數據。”因此,在整個軟件鏈上擁有自己的芯片有明顯的好處。

這就留下了一個問題:蘋果將如何在營銷中定位這一點?

正如我們上面提到的,蘋果從不談論他們的數據中心,但現在他們可能愿意這樣做,因爲它傳達了一個對他們有利的信息。事實上,考慮到有關該主題的媒體報道數量,我們懷疑蘋果可能故意泄露了一些內容,以確保我們關注。

當我們把這一切歸結起來時,蘋果似乎有一個有趣的故事來講述其人工智能產品的廣度。這不僅僅是一台人工智能 Mac 或人工智能 iPhone,而是一個提供某種形式的差異化人工智能的完整系統。如果這是真的(我們可能錯了),這將是蘋果在競爭中搶先一步的又一個例子,因爲這是其競爭對手難以匹敵的。


蘋果的底氣與必然


Apple 在芯片設計方面擁有豐富的經驗,自 2010 年的 Apple A4 起,公司就推出了多款自研的處理器。近年來,這家 iDevice 制造商已完全過渡到自己的 Arm 兼容芯片——正式放棄了英特爾的PC處理器。

蘋果最後一次退出服務器業務是在 2011 年,當時它永久關閉了 Xserve 系列——它還在 20 世紀 90 年代嘗試過服務器硬件,但不太成功。不過,盡管蘋果公司已經十多年沒有銷售服務器硬件了,但這並不是說針對服務器要求而調整的蘋果芯片不能用於服務內部工作負載。

從過去的歷史看來,他們可能想制造服務器芯片,但在庫比蒂諾無法制造,因爲那幫工程師離开了蘋果,並成立了Nuvia,而該公司現在依然是高通的一部分。

除了通用 CPU 內核之外,Apple 目前的 Arm 兼容芯片還擁有相當強大的集成 GPU 以及旨在加速機器學習操作的專用神經處理單元 (NPU)。

事實證明,最新的 M 系列芯片非常有能力 — 能夠以相當高的性能運行相當大的大型語言模型 (LLM)。這種能力很大程度上取決於蘋果自主芯片的設計方式。他們M系列Ultra 器件上的計算芯片與多達 8 個 LPDDR5x 內存模塊共同封裝,爲 CPU 和 GPU 提供高達 800GB/秒的內存帶寬。

內存帶寬是推理性能的關鍵因素,也是我們看到 AMD 和 Nvidia 等 GPU 制造商轉向更快的高帶寬內存以避免瓶頸的原因之一。

雖然我們看到的大多數在這些芯片上運行的LLM都通過 Metal API 使用 GPU,但蘋果早前推出了M4 以及更新的 iPad,將其 NPU 性能提升至 38 TOPS,使其遠遠領先於英特爾和 AMD 目前的一代產品。

傳聞中的蘋果服務器芯片是否與我們已知的 A 系列和 M 系列有任何相似之處還有待觀察。但看到庫比蒂諾走這條路一點也不奇怪。

截至 2024 年,幾乎所有主要科技公司都已部署或正在开發用於人工智能推理或訓練的定制芯片。隨着Meta 訓練和推理加速器 v2 (MTIA v2) 的廣泛部署, 他們成爲最新推出定制芯片的超大規模企業。

雖然現在很多人工智能關注點都集中在 OpenAI 的 ChatGPT、Google 的 Gemini 或微軟基於 OpenAI 的 Copilot 等流行聊天機器人和服務背後的LLM,但 MTIA 實際上是爲運行 Meta 的內部推薦模型而設計的——用於廣告選擇和投放等。

谷歌的TPU和亞馬遜的 Trainium 和 Inferenia 套件也有類似的情況,它們最初是爲了運行各自的內部工作負載而开發的。但是,與大多數雲基礎設施一樣,過剩容量最終會向公衆开放。剩下的就是微軟,該公司去年秋天才公布了其定制 CPU 和人工智能芯片。

考慮到蘋果公司的運營規模,我們有理由相信,通過將現有的機器學習工作負載(尤其是那些太大而無法在設備上運行的工作負載)轉移到內部構建和控制的高度優化的硅片上,蘋果公司看到了削減成本的機會。

然而,並不是所有人都相信。值得注意的是,蘋果觀察人士馬克·古爾曼 (Mark Gurman) 早前對此表示了懷疑,他發帖稱,雖然蘋果在 2018 年左右啓動了一個开發服務器芯片的項目,但該計劃被放棄了。他補充說,缺乏差異化、高成本以及對設備端人工智能的關注使得這一前景變得更加不可能。

即便如此,在人工智能熱潮中,蒂姆·庫克仍面臨着巨大的投資者壓力,要求他更公开地討論蘋果的战略。幾個月前,微軟佔據了最有價值公司排行榜的榜首,至少部分是因爲雷德蒙德在人工智能領域的領先地位。我們在這裏更詳細地討論了蘋果的人工智能战略。

直到今年春天,蘋果在營銷中基本上避免使用“人工智能”,而更喜歡使用“機器學習”一詞——而且只是很少使用。隨着 3 月份 M3 MacBook Air 的推出,所有這一切都發生了變化,當時它被譽爲“世界上最好的人工智能消費筆記本電腦”。

因此,即使正如古爾曼所說,蘋果服務器芯片已經被排除在外,但庫克顯然渴望改變他在人工智能競賽中落後的看法。



標題:蘋果爲何自研這顆芯片?

地址:https://www.iknowplus.com/post/109318.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。