Apple 與 Google 簽訂多年合作協議,將 Google Gemini 大型語言模型整合至 Siri 語音助手。此合作屬於 Apple Intelligence 戰略的核心組成部分。Apple Foundation Models 第 10 版達到約 1.2 萬億參數規模,運行於 Apple Private Cloud Compute 基礎設施。Gemini 以白標形式嵌入 Siri,終端用戶不會看到 Google 品牌標識。此次升級標誌著 Siri 從傳統指令式助手轉型為對話式 AI 代理。
Siri 自 2011 年隨 iPhone 4S 發佈以來,一直是 Apple 裝置的語音互動入口。過去數年,Siri 在自然語言理解、多輪對話、複雜任務處理等能力上落後於 ChatGPT、Google Assistant 及其他 AI 助手。Apple 選擇與 Google 合作引入 Gemini 模型,目標是在保持隱私標準的前提下大幅提升 Siri 的語言推理能力。
一、Apple 與 Google 的 Gemini 合作協議
合約結構與商業條款
Apple 與 Google 簽訂的合約為多年期協議。Google 向 Apple 提供 Gemini 模型的 API 存取權限,Apple 將 Gemini 整合至 Siri 後端推理系統。此合約的商業模式與兩家公司在搜尋引擎領域的合作模式相似——Google 長期向 Apple 支付費用,使 Google Search 成為 Safari 預設搜尋引擎。Gemini 合作的財務條款未公開,但此協議使 Google 模型觸及全球超過 20 億台 Apple 裝置。
合作範疇與技術分工
Apple 負責 Siri 前端介面設計、裝置端模型推理、隱私層架構設計。Google 負責提供 Gemini 雲端模型的推理能力,處理 Siri 無法在裝置端完成的複雜查詢。兩家公司各自維護自己的基礎設施,數據傳輸通過 Apple 設計的隱私緩衝層進行。
| 合作維度 | Apple 負責範疇 | Google 負責範疇 |
|---|---|---|
| 模型層 | Apple Foundation Models(裝置端 + PCC) | Gemini 雲端模型 |
| 介面層 | Siri UI、語音辨識、多模態輸入 | 不涉及前端 |
| 隱私層 | Private Cloud Compute、隱私緩衝層 | 接收匿名化數據 |
| 基礎設施 | Apple Silicon 伺服器叢集 | Google Cloud TPU 叢集 |
| 品牌呈現 | Siri 品牌(唯一可見品牌) | 白標(不可見) |
二、Apple Foundation Models 技術規格
AFM 第 10 版參數規模
Apple Foundation Models(AFM)第 10 版的參數規模達到約 1.2 萬億(1.2 trillion)。此模型運行於 Apple Private Cloud Compute(PCC)基礎設施,使用 Apple 自研晶片驅動的伺服器。AFM 10 是 Apple 迄今最大的語言模型,承擔 Siri 核心推理任務中需要雲端處理的部分。
裝置端與雲端的混合推理架構
Apple 的 AI 推理採用三層架構。第一層為裝置端推理,使用較小的模型處理低延遲任務,如快速回覆、基本指令解析。第二層為 Apple Private Cloud Compute,處理需要較大模型能力的任務。第三層為 Gemini 雲端推理,處理超出 AFM 能力範圍的複雜查詢。
| 推理層級 | 運行位置 | 模型規模 | 典型任務 |
|---|---|---|---|
| 第一層 | iPhone / iPad / Mac 裝置端 | 數十億參數 | 快速回覆、文字自動完成、基本指令 |
| 第二層 | Apple Private Cloud Compute | 約 1.2 萬億參數(AFM 10) | 長文本分析、複雜推理、個人化回應 |
| 第三層 | Google Cloud(Gemini) | Gemini 系列模型 | 超複雜查詢、廣泛知識檢索、多步推理 |
Apple 的三層推理架構設計優先在裝置端處理數據。只有裝置端模型無法處理的任務才會上傳至 PCC。只有 PCC 也無法處理的任務才會路由至 Gemini。此設計最大化了隱私保護,同時確保 Siri 具備處理複雜查詢的能力。
三、白標整合模式:Gemini 的隱形角色
白標(White-Label)的定義與實施
白標整合指 Google Gemini 模型在 Siri 中以不可見的方式運作。用戶與 Siri 互動時,不會看到任何 Google 或 Gemini 品牌標識。所有回應均以 Siri 的名義呈現。此模式與 Apple 當前處理 ChatGPT 整合的方式不同——Apple Intelligence 中的 ChatGPT 整合會明確告知用戶正在使用 OpenAI 模型。
白標模式的戰略意義
Apple 選擇白標模式有三個原因。第一,維持 Siri 品牌的統一性,避免用戶產生「Siri 只是 Gemini 的包裝」的認知。第二,保留更換後端模型供應商的靈活性——Apple 無需向用戶解釋底層模型的變更。第三,Apple 正在開發自研下一代模型 Ferret-3,白標模式使未來從 Gemini 過渡至 Ferret-3 時用戶體驗保持不變。
四、Siri 新功能:個人化情境與應用操作
Personal Context 個人化情境系統
Personal Context 是 Siri 升級中最核心的新功能。此系統使 Siri 能夠存取用戶的電子郵件、訊息、日曆、聯絡人等個人數據,並基於這些數據提供情境感知的回應。典型應用場景包括:
- 郵件摘要:Siri 讀取收件匣中的最新郵件,生成重點摘要並建議回覆內容
- 日程協調:Siri 根據日曆中的已有安排,自動建議新會議的可用時段
- 訊息情境:用戶說「回覆 David 關於明天午餐的事」,Siri 自動找到相關對話線程,生成符合上下文的回覆
- 跨應用數據關聯:Siri 將郵件中提到的航班資訊與日曆事件自動關聯,提供出行提醒
螢幕感知(On-Screen Awareness)
螢幕感知功能使 Siri 能夠理解用戶當前螢幕上顯示的內容。用戶可以指向螢幕上的餐廳名稱說「訂今晚七點的位」,Siri 識別螢幕上的餐廳資訊並執行預訂操作。此功能需要多模態理解能力——Siri 必須同時處理語音輸入與螢幕視覺內容。
應用內操作(In-App Actions)
應用內操作使 Siri 能夠在第三方應用中執行具體操作。Siri 不再局限於打開應用,而是能夠在應用內部完成多步任務。此功能依賴 Apple 的 App Intents 框架,開發者需要將應用功能註冊為 Siri 可調用的操作。
| 新功能 | 功能描述 | 技術依賴 | 預計發佈 |
|---|---|---|---|
| Personal Context | 存取郵件、訊息、日曆的個人化回應 | 裝置端索引 + PCC 推理 | iOS 26.4 / 26.5 |
| 螢幕感知 | 理解當前螢幕內容並執行相關操作 | 多模態模型 + 視覺理解 | iOS 26.5 |
| 應用內操作 | 在第三方應用內完成多步任務 | App Intents + Gemini 推理 | iOS 26.5 / iOS 27 |
| 多輪對話 | 支援長上下文的連續對話 | AFM 10 + 對話狀態管理 | iOS 26.4 |
| 自然語言理解 | 理解模糊、非結構化的語音指令 | Gemini NLU + 裝置端模型 | iOS 26.4 |
五、隱私架構:Private Cloud Compute
Apple Private Cloud Compute 的運作機制
Apple Private Cloud Compute(PCC)是 Apple 專為 AI 推理設計的雲端基礎設施。PCC 的核心設計原則為:伺服器端不保留用戶數據。每次推理請求完成後,所有用戶數據從伺服器記憶體中清除。PCC 伺服器使用 Apple Silicon 晶片,運行定製版 macOS,支援獨立安全研究人員審計其原始碼。
隱私緩衝層:Apple 與 Google 之間的數據隔離
當 Siri 請求需要路由至 Gemini 時,數據首先通過 Apple 設計的隱私緩衝層。此緩衝層執行以下操作:
- 數據匿名化:移除所有可識別用戶身份的資訊(姓名、電話號碼、裝置識別碼等)
- 情境剝離:將查詢的核心語義保留,但移除與用戶個人身份相關的情境
- 臨時會話:每次 Gemini 請求使用獨立的臨時會話,Google 無法跨請求追蹤同一用戶
- 回應過濾:Gemini 的回應通過 Apple 過濾層後才返回給用戶,確保不包含外部追蹤元素
Apple 的隱私設計確保 Google 收到的是經過匿名化處理的查詢。Google 不知道查詢來自哪個用戶、哪台裝置、哪個地理位置。此架構使 Apple 能夠利用 Gemini 的推理能力,同時維持其一貫的隱私承諾。
PCC 與傳統雲端 AI 服務的隱私對比
| 隱私屬性 | Apple PCC | 傳統雲端 AI |
|---|---|---|
| 數據保留 | 推理完成後即時清除 | 通常保留用於模型改進 |
| 硬件控制 | Apple 自研晶片,端到端控制 | 通用伺服器硬件 |
| 原始碼審計 | 支援獨立安全研究人員審計 | 通常不公開 |
| 用戶身份關聯 | 請求與用戶身份脫鉤 | 通常與帳戶關聯 |
| 加密方式 | 端到端加密,加密密鑰在裝置端 | 傳輸層加密,伺服器端可解密 |
六、發佈時間表:iOS 26.4 至 iOS 27
原定與調整後的時間表
Apple 原定於 2026 年 3 月在 iOS 26.4 中推出全部 Siri 升級功能。受技術複雜度影響,部分功能延期。當前時間表如下:
| 版本 | 預計發佈時間 | 包含功能 |
|---|---|---|
| iOS 26.4 | 2026 年 3 月(延期中) | 基礎 Gemini 整合、改進的自然語言理解、多輪對話 |
| iOS 26.5 | 2026 年 5 月 | Personal Context、螢幕感知、部分應用內操作 |
| iOS 27 | 2026 年 9 月 | 完整 Campos 架構、進階應用內操作、Gemini 擴展至 Safari/Spotlight |
延期原因分析
功能延期源於多個技術挑戰。Personal Context 需要在裝置端建立全面的個人數據索引,同時確保索引過程不影響裝置性能和電池壽命。螢幕感知功能需要多模態模型在低延遲條件下運行,對裝置端算力有較高要求。應用內操作需要第三方開發者更新其應用以支援新的 App Intents API,生態系統建設需要時間。
Apple 選擇分階段發佈 Siri 升級功能,而非一次性推出所有功能。iOS 26.4 提供基礎能力。iOS 26.5 增加個人化功能。iOS 27 實現完整架構升級。此策略降低了每次更新的風險,並為開發者提供更充裕的適配時間。
七、WWDC 2026 與 Campos 架構
Campos 代號的含義
Apple 將在 WWDC 2026(2026 年 6 月)正式發表代號為「Campos」的全新 Siri 架構。Campos 代表 Siri 從指令處理器到對話式 AI 代理的架構性轉變。現有 Siri 架構基於意圖辨識(Intent Recognition)模式——將用戶語音映射為預定義的指令集。Campos 架構改用大型語言模型作為核心推理引擎,支援開放式對話和動態任務規劃。
Campos 架構的技術特徵
- LLM 原生推理:所有用戶請求首先經過 LLM 理解和規劃,取代傳統的意圖分類器
- 動態工具調用:Siri 根據 LLM 推理結果動態選擇和組合工具(應用、API、系統功能),而非依賴預設的指令映射
- 持久對話記憶:支援跨會話的對話歷史,用戶可以引用之前的對話內容
- 多代理協作:複雜任務可以分解為多個子代理並行執行,每個子代理負責一個特定領域(郵件、日曆、地圖等)
- 自適應模型路由:根據任務複雜度自動在裝置端模型、PCC、Gemini 之間路由
Campos 與現有 Siri 的架構對比
| 架構維度 | 現有 Siri | Campos(新架構) |
|---|---|---|
| 核心引擎 | 意圖辨識分類器 | 大型語言模型 |
| 任務規劃 | 預定義指令映射 | 動態規劃與工具調用 |
| 對話模式 | 單輪指令 | 多輪持久對話 |
| 錯誤處理 | 「我不確定我理解」 | 語義推理與澄清提問 |
| 擴展性 | 需要 Apple 逐一添加新指令 | 開發者通過 App Intents 自助擴展 |
八、Apple 自研模型 Ferret-3
Ferret 系列模型的演進
Apple 正在開發代號為 Ferret-3 的下一代自研大型語言模型。Ferret 系列始於 Apple 與哥倫比亞大學的聯合研究,初期版本為多模態模型,專注於視覺理解與語言推理的結合。Ferret-3 的目標是在 2026 年至 2027 年間逐步取代對外部模型(包括 Gemini)的依賴。
Ferret-3 的戰略定位
Apple 引入 Gemini 是短中期策略。長期目標是建立完全自主可控的 AI 模型體系。Ferret-3 的開發重點包括:
- 多模態原生能力:Ferret-3 設計為原生多模態模型,同時處理文字、圖像、語音、影片輸入
- Apple Silicon 優化:模型架構針對 Apple Silicon 晶片的神經網絡引擎深度優化
- 裝置端運行能力:Ferret-3 的壓縮版本可在 iPhone 和 iPad 上直接運行
- 隱私原生設計:模型訓練過程採用差分隱私和聯邦學習技術
Gemini 合作為 Apple 爭取了時間。Apple 可以在 Ferret-3 尚未就緒時,通過 Gemini 提供有競爭力的 AI 助手體驗。一旦 Ferret-3 達到商用品質,白標架構使 Apple 能夠無縫切換底層模型,用戶端不受任何影響。
九、Gemini 擴展至 Safari 與 Spotlight
Safari 瀏覽器中的 Gemini 整合
Gemini 的整合不局限於 Siri。Apple 計劃將 Gemini 推理能力擴展至 Safari 瀏覽器。預期功能包括:
- 智能網頁摘要:Safari 自動生成當前網頁的內容摘要,用戶無需閱讀全文即可獲取重點
- 跨頁面資訊綜合:用戶打開多個相關網頁時,Safari 自動綜合多頁資訊並生成比較分析
- 即時翻譯增強:基於 Gemini 的翻譯品質顯著高於現有 Safari 內建翻譯功能
- 智能搜尋建議:Safari 搜尋欄提供基於 LLM 的搜尋建議,理解自然語言查詢意圖
Spotlight 搜尋中的 Gemini 整合
Spotlight 是 Apple 裝置的系統級搜尋功能。Gemini 整合後,Spotlight 將具備自然語言查詢能力。用戶可以輸入「上週三 David 發給我的那份關於預算的 PDF」,Spotlight 通過語義理解定位正確檔案,而非依賴關鍵字匹配。Spotlight 也將支援問答式查詢,如「我下個月有多少場會議」——系統綜合日曆數據後直接回答。
十、科技巨頭 AI 助手競爭格局
主要 AI 助手平台對比
Apple 的 Siri 升級處於全球科技巨頭 AI 助手競賽的背景下。以下為主要平台的現狀對比:
| AI 助手 | 所屬公司 | 底層模型 | 核心優勢 | 裝置生態 |
|---|---|---|---|---|
| Siri + Apple Intelligence | Apple | AFM + Gemini | 隱私架構、裝置整合深度 | iPhone、iPad、Mac、Apple Watch、HomePod、Vision Pro |
| Google Assistant + Gemini | Gemini | 搜尋資料整合、多模態 | Android、Pixel、Nest、Chromebook | |
| Copilot | Microsoft | GPT-4o | Office 365 整合、企業部署 | Windows、Xbox、Surface |
| Alexa+ | Amazon | Claude + 自研模型 | 智能家居控制、電商整合 | Echo、Fire TV、Ring |
| Meta AI | Meta | Llama | 社交媒體整合、開源生態 | Ray-Ban Meta、Quest、WhatsApp、Instagram |
Apple Intelligence 的差異化定位
Apple Intelligence 的差異化在於隱私優先的設計哲學。Google 和 Meta 的商業模式依賴數據收集。Microsoft 的 Copilot 偏重企業生產力場景。Apple 將隱私保護作為核心賣點,Private Cloud Compute 和隱私緩衝層構成了其他平台難以複製的競爭壁壘。Apple 對超過 20 億台活躍裝置的控制權也意味著 Siri 升級能在短時間內觸及最大規模的用戶群。
模型供應鏈的戰略思考
科技巨頭的 AI 助手形成了複雜的模型供應鏈。Apple 使用 Google 的 Gemini。Amazon 使用 Anthropic 的 Claude。Samsung 同時與 Google 和多家模型供應商合作。此供應鏈結構表明,底層 AI 模型正在成為基礎設施級別的商品,差異化競爭逐漸轉向應用層和體驗層。Apple 的戰略是在應用層和體驗層建立優勢,同時通過 Ferret-3 逐步實現模型層的自主可控。
十一、對香港用戶與企業的影響
香港用戶的功能可用性
Apple Intelligence 的功能推出遵循地區解鎖策略。初期功能通常先在美國英語環境中發佈,繁體中文(香港)的支援通常在後續更新中加入。香港用戶可以通過將 Siri 語言設為英語率先體驗新功能。完整的繁體中文支援預計在 iOS 27 週期內推出。
企業 AI 策略的啟示
Apple 與 Google 的合作為香港企業的 AI 策略提供了多個啟示:
- 隱私優先的 AI 部署:Apple 的三層推理架構展示了如何在利用 AI 能力的同時保護數據隱私。香港企業在部署 AI 解決方案時應參考此設計原則
- 混合模型策略:Apple 同時使用自研模型和第三方模型的做法,啟示企業不必選擇單一 AI 供應商。根據任務類型選擇最適合的模型,能夠在成本和效能之間取得平衡
- AI 助手對工作流程的影響:Personal Context 和應用內操作功能將改變員工與裝置的互動方式。企業應提前評估這些功能對現有工作流程的影響
- 開發者機會:App Intents 框架為香港開發者提供了新的價值創造機會。將應用功能與 Siri 深度整合,能夠提升應用的使用頻率和用戶黏性
學習 AI 的重要性
Apple 將 AI 助手定位為操作系統的核心互動層。此趨勢意味著 AI 不再是可選的附加功能,而是基礎的互動介面。理解 AI 助手的運作原理、熟悉 Prompt Engineering 技巧、掌握 AI Agent 概念,對每個專業人士都具有直接的實用價值。Apple 的 Siri 升級計劃進一步證實:AI 素養正在成為職場基本技能。
Apple 引入 Gemini 重建 Siri 代表了 AI 助手進入新階段。三層推理架構、白標整合模式、隱私緩衝層設計——這些技術決策背後是 Apple 對 AI 時代的系統性佈局。香港用戶和企業應關注此發展趨勢,在 AI 技術加速普及的背景下提升自身的 AI 應用能力。
掌握 AI 助手時代的核心技能
AI 正在成為操作系統的核心。學習 AI 原理與應用技巧,在 AI 助手時代保持競爭力。歡迎查詢 aicourse.com.hk 的專業 AI 課程。
瀏覽所有課程或電郵至 ivan@hdcourse.com 查詢課程詳情