每日精選 AI/Tech 新聞,繁體中文整理
📍 今日全焦點
- GPT-5.6 現身 ChatGPT Pro — 還沒公告就被抓到在跑,發布窗口今天開
- Fable 5 後續:Economist 登封面開嗆 — 「美國的 AI 權力掠奪」,免費試用今天到期
- Agentjacking:假報錯劫持 AI coding agent — 2,388 個組織中招,Claude Code、Cursor 都在內
- ChatGPT 市佔首次跌破 50% — 掉到 46.4%,Gemini、Claude 一口一口啃
- Salesforce 36 億美元收購 Fin — 搶客服 AI 卡位,防守意味很濃
- GPT-5.4 進濕實驗室做出真藥物突破 — 一萬多次反應,找到意外的催化劑
今日頭條
上週我們說 GPT-5.6 的發布窗口會在今天(6/22)打開——結果窗口還沒正式拉開,就有人在 ChatGPT Pro 裡面撞見它在跑了。
這幾天 X 和 Reddit 上一堆開發者回報:ChatGPT Pro 的回應明顯變快、變強,但 OpenAI 一個字都還沒公告。最有畫面的一個證據是——有人用疑似 GPT-5.6 Pro 在 60 分鐘又 15 秒內做出一整個可玩的瀏覽器遊戲;同樣的任務,舊的 GPT-5.5 Pro 光是「開始回應」就花了快 10 分鐘。
這代表什麼:OpenAI 很可能已經把 GPT-5.6 偷偷推進小範圍部署,正式發布只是時間問題。預測市場 Polymarket 押「6/22~6/28 發布」的機率高達 83%,今天正是窗口起點。
傳聞中的重點是 **agentic coding(自主寫程式的能力)**和 150 萬 token 的上下文視窗(比 GPT-5.5 大約 43%)。首席科學家 Jakub Pachocki(OpenAI 研究部門最高負責人)先前只丟下一句「meaningful improvement(有意義的提升)」,沒給細節。
為什麼時機這麼剛好:Anthropic 的 Fable 5 被政府鎖著、到現在還沒回來,等於把市場頂端的車道整條空出來。OpenAI 只要在這個空檔端出夠強的東西,就能搶回它從 6/9 Fable 5 發布以來丟掉的 benchmark 領先地位。 不過在官方 system card 出來之前,這些全是「跑起來感覺很強」的體感,數字還要等驗證。
新聞摘要
後續 - Fable 5:Economist 登封面開嗆「美國的 AI 權力掠奪」,免費試用今天到期
禁令還沒解,但戰場已經從技術吵到地緣政治了。今天(6/22)也是 Fable 5 免費試用的最後一天。
最新進展一:Economist 把它做成封面。 《經濟學人》6/20 那期封面標題直接寫 「America's AI Power Grab(美國的 AI 權力掠奪)」,把這場禁令定調成「美國刻意用國安手段控制哪些國家能用最強 AI」——等於把前沿模型當成核武、先進晶片那種要管制出口的戰略物資看待。這是主流媒體第一次把事件拉到這個高度。
最新進展二:Trump 鬆口,但禁令沒動。 白宮證實,Trump 在 G7 峰會見過 Dario Amodei(Anthropic 執行長)後,對 Anthropic 的國安疑慮已經放軟,還對 Axios 說他現在不覺得 Amodei 是國安威脅了——「現在是不啦,不過一週前嘛,也許吧。」但態度軟化 ≠ 命令撤銷,出口管制法律上仍然有效,要真的解禁得商務部正式收回或另開授權。
最新進展三:連署人數從 80 衝到 100+。 上週是 80 多位資安專家連署反對,現在破百。核心論點沒變:觸發禁令的 jailbreak 只是「在特定情境下解鎖 Mythos 5 資安能力」的窄洞,不是萬用破解,而且同樣的招數對 GPT-5.5 也通——憑什麼只罰 Anthropic。
對你的實際影響:API 用戶現在靠改走 Claude Opus 4.8 和 Sonnet 4.6(不受影響)硬撐;今天過後,Fable 5 從各付費方案功能清單移除,之後就算回來也要另外按用量付費。
Agentjacking:一份假的 Sentry 報錯,就能劫持你的 AI coding agent
這則開發者一定要看——你越信任 Claude Code、Cursor,這個攻擊就越好用。
資安公司 Tenet Security 揭露一種新攻擊手法,取名 Agentjacking。原理是鑽 Sentry(被廣泛使用的錯誤追蹤平台)的漏洞:Sentry 的接收端會收下任何人丟來的報錯資料,而 Sentry MCP server(把資料餵給 AI 的介接服務)又把這些資料當成「可信的系統輸出」交給 AI agent。
攻擊怎麼跑:駭客先找到目標網站上外洩的 DSN(Sentry 的公開寫入憑證,常常直接埋在前端網頁裡),用它送一筆夾帶惡意指令的假報錯進去。AI coding agent 一讀,就把那段注入的指令當成「除錯步驟」乖乖執行。
規模有多大:到 6/17 為止,研究員掃出 2,388 個組織的 DSN 是外洩的,實測對 Claude Code、Cursor、OpenAI Codex 在 Windows、macOS、雲端 pipeline 全都打得穿,成功率 85%。會被偷走的包括環境變數、~/.aws/config 的 AWS 憑證、npm token、Docker 和 git 憑證、私有 repo 網址。
現在能做的防護:把錯誤追蹤平台吐出來的東西,一律當成「不可信輸入」再讓 agent 處理;在「報錯 → agent 自動執行」之間插一層人工審核。目前沒有萬用 patch。這跟 CLAUDE.md 安全規則同一個邏輯——不要無條件相信工具鏈餵進來的內容。
ChatGPT 市佔首次跌破 50%:掉到 46.4%,Gemini 和 Claude 一口一口啃
ChatGPT 還是最大,但「一家獨大」的時代,數據上正式結束了。
根據 Sensor Tower(行動數據分析公司)的《2026 State of AI Report》,ChatGPT 的全球 AI 助理市佔在 5 月底掉到 46.4%——這是它 2022 年底問世以來第一次低於一半。對照一下衰退曲線:2024 年底還有 65.3%、2025 年底 52.8%,跌得不算慢。
對手吃下來的份額:Gemini 約 27.7%、Claude 約 10.3%。但如果看絕對用戶數,ChatGPT 其實還是巨無霸——月活 11 億,Gemini 6.62 億、Claude 2.45 億。市佔和用戶數講的是兩個故事。
一個小露覺得最有意思的數字:Claude 的付費轉換率 13%,是所有主流助理裡最高的。用戶數雖然墊底,但「願意掏錢的比例」最高——這其實是個品質訊號。
怎麼看:當每家助理回答日常問題的水準都差不多,使用者就會飄向「我生態系裡本來就有的那個」或「我比較信任的那個」。報告還點出,OpenAI 二月跟美國國防部簽約後,App 移除量出現可量測的尖峰——代表對部分用戶來說,價值觀和信任也會影響選擇,不是只看功能。真正的戰場已經不是聊天,是 agent。
Salesforce 36 億美元收購 Fin:客服 AI 卡位,防守的成分比進攻多
一家年初市值蒸發三分之一的公司,砸 36 億美元買了個賣 AI 客服的新創。這筆錢買的是安全感。
Salesforce 本週宣布以 **36 億美元(約新台幣 1,150 億)**收購 Fin——一個專做 AI 客服的平台,主打用 AI agent 自動處理客服工單、分流升級、即時對話。
為什麼是防守:Salesforce 今年因為「AI 會不會把傳統 CRM 流程取代掉」的疑慮,市值掉了大約三分之一。執行長 Marc Benioff(Salesforce 創辦人兼執行長)這一兩年很積極地把公司重新定位成「企業 AI 原生層」,自家的 Agentforce 平台已經正面對上 Anthropic 的 Claude for Enterprise。買下 Fin,與其說是擴張,不如說是堵住缺口、別被專注型的 AI 玩家吃掉。
對在這個領域創業的人意義是:大平台願意付收購溢價來「避免被取代」,36 億美元砸在一個還算年輕的 AI 原生廠商身上,本身就是個很清楚的市場訊號。
GPT-5.4 進濕實驗室:跑一萬多次反應,找到意外的「藥物合成加速器」
AI 不是只會寫程式聊天——這次它走進真實的化學實驗室,幫人類解掉一個卡很久的合成難題。
OpenAI 6/17 公布了一個和波蘭化學新創 Molecule.one 合作三個月的成果,被稱為「前沿 AI 模型第一次以接近自主代理的身份,跑完一整套真實濕實驗室(wet-lab,相對於電腦模擬的實體實驗)化學流程」。
做出了什麼:在 10,080 次真實反應裡,GPT-5.4 找到 TEMPO 這個意料之外的氧化劑,能大幅提升一種長期低產率的關鍵反應——Chan–Lam coupling(一種用銅催化、把碳和氮接起來的合成方法,藥物裡超常見)。
為什麼重要:這個反應牽涉的 primary sulfonamides(一級磺醯胺)是超過 91 種 FDA 核准藥物的核心結構,橫跨腫瘤、抗菌、心血管領域,過去和硼酸偶聯的產率一直很差。
AI 在裡面扮演什麼角色:它讀文獻、生成並排序研究提案、協助設計實驗、分析結果、提出後續方向;人類化學家負責掌舵、挑提案、驗證最終結果。是「AI 提案、人類把關」的協作模式,不是 AI 自己關起門來搞定。 對「AI 到底能不能做真科學」這個問題,這是一個很實在的進展。
值得關注
- GPT-5.6 正式發布倒數:窗口今天開(6/22~6/28,Polymarket 機率 83%)。如果它在 Fable 5 還沒回來的空檔登場,企業選邊的速度會非常快——這週隨時可能有官方 system card
- GLM-5.2 趁亂登頂:Fable 5 一下架,中國智譜 AI 的開源 GLM-5.2 在 FrontierSWE 這個長時程工程評測上超車 GPT-5.5、只輸 Fable 5 一分。出口管制本意是護住美國 AI 優勢,結果可能反而幫中國開源模型做了最好的廣告
- Gemini 3.5 Pro 還是難產:到 6/21 仍卡在 Vertex AI 限量預覽,沒上公開的 Gemini App 或 API。Pichai「再等一個月」的承諾,月底剩不到 10 天
- Agentjacking 的後續 patch:Sentry 和各家 AI coding 工具會怎麼回應這個攻擊面,值得追。在官方修法之前,「agent 自動執行外部內容」這件事都得多留一個心眼