Lukeverstopia
📰 Look AI 一分鐘

Google I/O 特別篇|Gemini 不只是聊天,它要變成 Google 的動作層

2026-05-20|作者:小露


這次 Google I/O 2026,如果只看發布清單會很累。

Gemini 3.5 Flash、Gemini Omni、Gemini Spark、AI Mode、Ask YouTube、Google Pics、Universal Cart、Android XR 眼鏡、Antigravity、AI Studio……每一個都像一則新聞,但全部放在一起,其實只有一個重點:

Google 正在把 Gemini 從「一個 AI App」,改造成 Google 產品宇宙裡的動作層。

以前 Google 的核心入口是搜尋框。你輸入關鍵字,Google 給你連結,你自己點進去、自己比較、自己整理、自己下決定。

現在 Google 想做的是另一件事:你描述目標,Gemini 幫你查、幫你整理、幫你生成介面、幫你追蹤任務,最後在你同意下幫你執行。

這不是「搜尋變聰明」而已。

這是 Google 在重寫它自己。


先講結論:這場 I/O 的三個訊號

第一個訊號:AI 從回答問題,進入執行任務。

Google 這次的關鍵詞是 agentic(代理式,意思是 AI 不只回答,而是能規劃並執行多步驟任務)。Gemini 3.5 Flash 主打 coding、長任務、工具使用;Gemini Spark 是 24/7 個人 AI Agent;Antigravity 是給開發者用的 agent-first 開發平台。

第二個訊號:Search 不再只是搜尋。

Google 說 AI Mode 已經突破 10 億月活躍使用者。接下來,搜尋框會變成能理解文字、圖片、檔案、影片、Chrome 分頁的智能入口,還能生成互動式圖表、模擬器、客製化 dashboard。

第三個訊號:Google 要把 Gemini 放進所有高頻場景。

Gmail、Docs、Keep、YouTube、Shopping、Android XR 眼鏡,全都被接上 Gemini。它不是要你每天打開一個 AI App,而是要讓 AI 住進你本來就在用的產品裡。

這是 Google 最可怕、也最有爭議的優勢:它已經掌握入口了。


Gemini 3.5 Flash:不是 Gemini 4,但可能更重要

外界原本期待 Google 在 I/O 發 Gemini 4。結果正式登場的是 Gemini 3.5 Flash

數字上看起來少了一點戲劇性,但產品策略上反而更清楚:Google 不是只想秀一個最強模型,而是要推出一顆能大規模跑 agent 工作流的引擎。

Gemini 3.5 Flash 是 Gemini 3.5 系列的第一個模型,Google 官方定位是「frontier intelligence with action」——白話講,就是把高階模型的推理能力,壓進一個速度夠快、能支撐大量任務執行的版本。

Google 宣稱它在多個 coding 和 agentic benchmark 上超過 Gemini 3.1 Pro,包括 Terminal-Bench 2.1、MCP Atlas、CharXiv Reasoning 等測試;輸出速度則比其他 frontier model 快 4 倍。

這裡的重點不是 benchmark 誰贏誰輸。

真正重要的是:Gemini 3.5 Flash 已經成為 Gemini App 和 Google Search AI Mode 的預設模型,也同步開放給 Google Antigravity、Gemini API、Google AI Studio、Android Studio 和企業平台。

也就是說,它不是實驗室展示品,而是直接進入產品線。

Google 還說 Gemini 3.5 Pro 正在內部使用,預計下個月推出。這個節奏很明顯:Flash 負責大規模執行,Pro 負責更深的推理和規劃。未來的 Agent 很可能不是單一模型完成全部工作,而是大模型當指揮,小模型當大量子任務執行者。

這點對工程師很重要。

未來寫程式用 AI,不會只是「請幫我補完這段 code」。而是你丟一個目標,AI 自己開子任務、讀 repo、跑測試、修 bug、做 migration,最後回來跟你報告。

Google 這次想證明的是:它不只會做聊天模型,它也想吃掉開發工作流。


Search:Google 最重要的產品,正在被 AI 重做

Google Search 是 Google 帝國的地基。

所以當 Google 說要做「25 年來搜尋框最大升級」時,這不是一句行銷話術而已。它代表 Google 願意動到自己的核心商業入口。

新的 AI 搜尋框可以接收更長、更口語的問題,也能吃多種輸入:文字、圖片、檔案、影片、Chrome 分頁。你不一定要想好關鍵字,你可以直接描述你想解決的問題。

Search 裡也會出現 Information agents。這些 agent 可以在背景追蹤你關心的主題,等有重要更新再通知你。美國部分類別還會支援讓 Google 幫你打電話給商家,例如居家維修、美容、寵物照護。

更大的變化是 Generative UI(生成式介面)

以前搜尋結果是「十個藍色連結」加上摘要。未來你問一個複雜問題,Search 可以即時產生一個互動介面:表格、圖表、動畫、模擬器,甚至是可以持續回來看的 dashboard。

這件事很猛,也很危險。

猛的地方是,Google Search 從「幫你找答案」變成「幫你做一個小工具」。例如你想理解天文、金融、硬體結構、旅遊安排,它可以直接生成一個可互動的解釋介面。

危險的地方是,網站和創作者會更難拿到流量。

如果答案、比較、圖表、影片摘要都在 Google 頁面裡完成,使用者還需要點進原始網站嗎?Google 會說它仍然提供來源連結,但內容生態最在意的問題是:當 AI 把資訊整理好,點擊還剩多少?

這會是接下來一年 AI Search 最大的戰場。

Google 一邊要對抗 ChatGPT、Perplexity 這些 AI-first 搜尋產品,一邊又不能把原本餵養搜尋引擎的開放網路弄到失血過多。

它要守住搜尋王座,但它守王座的方法,正在改變王座底下的地板。


Gemini Spark:Google 終於端出自己的 AI 管家

這次最像未來產品的,不是模型,而是 Gemini Spark

Spark 是 Google 的 24/7 個人 AI Agent。它整合 Gmail、Docs、Slides、Workspace 等產品,可以在雲端背景執行,不需要你一直開著電腦或手機。

它可以做什麼?

Google 的例子包括:整理信用卡帳單找出新訂閱費、追蹤小孩學校寄來的信件並做每日摘要、把會議紀錄和郵件整理成 Google Docs,再草擬後續 email。

這裡的關鍵不是功能聽起來多炫,而是 Google 已經有你的工作資料脈絡

OpenAI 和 Anthropic 要做個人助理,需要你授權連接 Gmail、Calendar、Drive、Slack、Notion。Google 不一樣,它本來就掌握 Gmail、Calendar、Docs、Drive、Chrome、Android。

這是巨大優勢,也是巨大信任問題。

Google 強調 Spark 會在使用者指示下運作,高風險動作像花錢、寄信前會先詢問。這句話很重要,因為 Agent 一旦能執行動作,錯誤就不只是「答錯」而已,而是可能真的寄錯信、買錯東西、改錯文件。

Spark 目前會先開放 trusted testers,接著在美國給 Google AI Ultra 訂閱者 Beta 使用。短期看起來還不是大眾產品,但方向很清楚:Google 想把 Gemini 從「你問我答」變成「我幫你盯著生活和工作」。

這也是 AI 公司接下來最想搶的位置:你的數位管家。


YouTube、Workspace、Omni:內容創作也被接上 Gemini

Google 這次不是只打搜尋和生產力,也打內容。

Gemini Omni 是新的多模態生成模型。Google 的說法是,它可以從任何輸入生成任何輸出,但第一階段先從影片開始。你可以用文字、圖片、影片當提示,生成或編輯影片;也可以用自然語言要求換背景、加鏡頭運動、修改風格。

這代表 Google 正在把生成式媒體整合進 Gemini App、Google Flow、YouTube Shorts 和 YouTube Create。

YouTube 也推出 Ask YouTube。使用者可以用口語問問題,YouTube 會從長影片和 Shorts 裡找出相關內容,整理成結構化回答,還可以追問。

這對創作者是雙面刃。

好處是影片被 AI 理解後,長尾內容可能更容易被找到。壞處是,如果使用者直接看 Ask YouTube 的整理答案,創作者的觀看時間和廣告收入會不會被稀釋?這個問題 Google 還沒有真正回答。

Workspace 這邊則是 Gmail Live、Docs Live、Keep voice、Google Pics、AI Inbox 一起上。

Gmail Live 讓你用語音問信箱裡的資訊;Docs Live 會把你講出來的想法整理成草稿;Keep 可以把碎念變成有結構的清單;Google Pics 則是新的圖片生成和編輯工具,強調可以選取圖片裡的特定物件修改,而不是每次重生整張圖。

這一整套其實在講同一件事:Google 想把創作流程從「打字操作軟體」,改成「用自然語言指揮 AI 改內容」。

如果 Microsoft 365 Copilot 的主場是企業辦公,那 Google Workspace 這次的打法更像是:把 email、文件、簡報、圖片、影片全部接成一個 Gemini workflow。


開發者工具:Google 也要搶 AI coding 主戰場

今年 I/O 的開發者線也很重。

Google Antigravity 2.0、Antigravity CLI、Antigravity SDK、Managed Agents in Gemini API、Google AI Studio Android 支援,全部都指向同一件事:讓開發者從 prompt 走到 production app。

Google AI Studio 現在可以直接做原生 Android app。你描述需求,它產生 Kotlin + Jetpack Compose 程式碼,在瀏覽器裡跑 Android Emulator,還能接 Google Play Internal Test Track。

這對 Android 生態很關鍵。

以前做 Android app,需要本機環境、SDK、Gradle、模擬器、Play Console 一堆設定。現在 Google 想讓初學者和非典型開發者直接在 AI Studio 裡用自然語言做原型,進階開發者再匯出到 Antigravity 接續開發。

另外,Google 也推出 Android CLI 和 Android skills,讓任何 AI Agent 都能呼叫 Android Studio 的能力,例如下載 SDK、跑 app、做 migration。甚至預告了 migration agent,可以把 React Native、web framework,甚至 iOS app code 轉成原生 Kotlin Android app。

這裡對台灣開發者有兩個觀察。

第一,AI coding 的競爭已經不是「誰補 code 比較準」,而是誰能掌握完整開發環境。Claude Code 有 terminal 和 repo 操作優勢;Cursor 有 IDE 體驗;Google 則直接握著 Android Studio、Play Store、Gemini API 和雲端部署。

第二,Google 正在把 Android 開發門檻往下壓。這會讓更多人做 app,但也會讓真正的工程品質更重要。因為 AI 可以生 code,不代表它會自然生出可維護、可測試、可上架、可長期演進的產品。

工具變簡單,不代表工程變簡單。

只是問題從「怎麼寫出來」,變成「怎麼判斷它寫得對不對」。


眼鏡、購物車、支付:Google 在找下一個入口

除了軟體,Google 也把 Gemini 往新入口推。

Android XR 智慧眼鏡會先從 audio glasses 開始,預計今年秋天推出,合作夥伴包含 Samsung、Gentle Monster、Warby Parker。它可以讓你問 Gemini 眼前看到的東西、聽導航、傳訊息、拍照、翻譯文字和語音。

這其實是 Google Glass 當年那條路線的重啟,只是這次底層不再是「把手機通知投到眼前」,而是「讓 AI 看到你看到的世界」。

購物這邊則是 Universal Cart

Google 想做一個跨 Search、Gemini、YouTube、Gmail 的智慧購物車。你看到商品可以先丟進 cart,Gemini 在背景幫你追價格、比規格、檢查相容性,最後透過 Google Pay 或商家網站結帳。

更底層的是 Agent Payments Protocol(AP2),目標是讓 AI Agent 可以在明確限制和可驗證紀錄下替你付款。

這聽起來像小功能,但商業意義很大。

如果未來 AI Agent 幫你比較商品、決定購買、完成付款,那「誰控制 Agent」就會變成新的電商入口。Google 不想只當搜尋廣告平台,它也想成為 agentic commerce(代理式商務)的基礎設施。


我的觀察:Google 的優勢很大,風險也很大

這次 Google I/O 讓我最明確感覺到一件事:

Google 不想再被定位成 AI 競賽裡追趕 OpenAI 的公司。它想把戰場拉回自己的地盤。

OpenAI 的地盤是 ChatGPT。Anthropic 的地盤是 Claude、開發者信任和企業安全感。Google 的地盤是 Search、YouTube、Gmail、Docs、Android、Chrome、Cloud。

所以 Google 的打法不是做一個更會聊天的 Gemini,而是把 Gemini 變成這些產品背後共同的執行層。

這個策略合理到有點可怕。

因為只要 Gemini 在每個 Google 產品裡都變得「夠好用」,使用者不一定會主動打開 ChatGPT 或 Claude。很多人會直接在原本的搜尋框、信箱、文件、手機、YouTube 裡使用 AI。

但風險也同樣大。

第一是信任。當 AI 能讀你的信、看你的文件、理解你的行程、幫你購物,使用者會問:Google 到底知道多少?資料怎麼用?錯了誰負責?

第二是內容生態。Search 和 YouTube 的 AI 摘要越強,原始網站和創作者越需要證明自己還能拿到流量與收入。

第三是產品複雜度。Google 很會做技術,但不一定總是把產品命名和路線講清楚。Gemini、AI Mode、Spark、Omni、Flow、Pics、Antigravity、AI Studio,全部一起來,使用者會不會搞混?這是 Google 老問題。

但無論如何,這次 I/O 的方向已經很明確。

Google 不是只在發表 AI 功能。

它是在宣布:未來 Google 的每個入口,都會逐漸變成 Gemini 的入口。

而這件事,會影響所有人。

使用者會改變搜尋和工作的方式。創作者會重新思考內容怎麼被發現。開發者會面對一個 AI-first 的 Android / web 開發流程。企業會開始評估「讓 Google 的 Agent 接進公司資料」到底可不可接受。

這就是 Google I/O 2026 真正值得寫一章的原因。

不是因為它發了很多功能。

而是因為它讓我們看到,Google 想把 AI 放在哪裡:

不是放在旁邊的聊天框。

是放在入口本身。


接下來要看什麼

  • Gemini 3.5 Pro 下個月發布:Flash 已經上線,Pro 才會決定 Google 的深度推理上限。
  • Gemini Spark Beta 的真實表現:24/7 Agent 聽起來很漂亮,但能不能穩定執行、怎麼處理權限和錯誤,才是關鍵。
  • AI Search 對網站流量的衝擊:AI Mode 進一步普及後,publisher、SEO、內容創作者會開始感受到更具體的壓力。
  • Antigravity 和 AI Studio 能否留住開發者:Google 有 Android 生態優勢,但開發者工具要贏,體驗和可靠度比 demo 更重要。
  • Android XR 眼鏡秋季上市後的反應:這是 Google 再次挑戰智慧眼鏡入口,這次 Gemini 會不會讓使用場景真的成立,值得追。