2026-06-28

每日精選 AI/Tech 新聞，繁體中文整理

📍 今日全焦點

tokenmaxxing 退燒了 — 企業不再無腦砸 AI 預算，Lindy 全面棄 Claude 改用 DeepSeek 省下數百萬美元，Uber 四個月燒光整年額度後開始設限
Anthropic 開戰指控 Alibaba — 致信美國參議院，控 Qwen 用 2.5 萬假帳號、2,880 萬次對話偷 Claude 能力，稱「史上最大蒸餾攻擊」
中國 Zhipu 趁亂逼近頂尖 — GLM-5.2 開源、跑分咬住 Opus 4.8，價格只要五分之一，正好踩在美國模型被綁手的空檔
Patronus AI 募 5,000 萬美元 — 推「數位世界模型」，要用模擬環境訓練 AI agent，押注 agent 可靠度這條賽道
後續 - Fable 5 第 16 天 — 仍是精確的「零流量」，7/8 生物辨識驗證上線可能是美國公民解禁的唯一出口

今日頭條

Uber 花了四個月，把一整年的 AI 預算燒光。然後它做了一件去年沒人會做的事——開始管員工用 AI 的開銷。

過去一年多，矽谷流行一個詞叫 tokenmaxxing（直譯「token 最大化」——公司鼓勵工程師盡量多用 AI、用好用滿，不太管成本，反正先衝生產力再說）。現在這個時代正在退場。

CNBC 6/26 的報導點出一個轉折：企業開始斤斤計較 AI 的每一分錢。

最有畫面的例子是 Uber。今年四月，Uber 技術長公開承認，公司在四個月內就把整年的 AI 預算燒光了。結果就是現在它對部分 AI 工具設了分級額度——基本盤每人每月 1,500 美元（約新台幣 4.8 萬），要更多得另外申請。

更狠的是 AI agent 新創 Lindy。它的執行長直接把全部流量從 Anthropic 的 Claude 搬到 DeepSeek（中國的開源權重模型，便宜很多），預估幾個月內省下數百萬美元。一個重度用 Claude 的公司，說換就換。

這跟你有什麼關係：如果你是工程師，過去那種「反正公司付錢，AI 隨便用」的好日子可能要收尾了；如果你做的是 AI 產品，客戶會開始問「我為什麼要付這麼多 token 錢」。

怎麼看：這件事的時機很微妙。OpenAI 和 Anthropic 都正在衝 IPO，最不想看到的就是「大客戶縮手」的故事——偏偏這故事現在開始發生了。一位分析師講得直白：他擔心的是最大的那些企業客戶，開始要管自己失控的 token 開銷。

便宜、開源、夠用的模型（DeepSeek、GLM）正好接住這股需求。這不只是省錢，是整個市場從「比誰最強」慢慢轉向「比誰最划算」——而這個轉向，對美國兩強的估值故事不是好消息。

來源：CNBC — OpenAI and Anthropic face new AI reality as users shift from 'tokenmaxxing' to efficiency | The New Stack — This AI agent startup ditched Anthropic for DeepSeek | Stocktwits — 'Tokenmaxxing' Is Fading, Say Experts

新聞摘要

Anthropic 致信參議院：Alibaba 用 2.5 萬假帳號發動「史上最大蒸餾攻擊」

這則是 AI 版的工業間諜案——只是偷的不是圖紙，是模型的「腦袋」。

Anthropic 寄了一封日期 6/10 的信給美國參議院銀行委員會，指控與 Alibaba（阿里巴巴）旗下 Qwen AI 實驗室有關的人馬，對 Claude 發動了「史上規模最大」的蒸餾攻擊（distillation attack）。

先解釋什麼是蒸餾攻擊。蒸餾本來是個正常技術：用一個強模型的輸出，去訓練一個比較弱、比較小的模型，讓小模型「學會」大模型的本事。問題是——如果你拿的是別人家模型的輸出來偷學，那就變成偷竊。Anthropic 說對方就是在做這件事，鎖定 Claude 最值錢的兩塊：寫程式和 agentic 推理能力。

規模大到誇張：這波攻擊從 4/22 跑到 6/5，動用約 25,000 個假帳號，總共跟 Claude 對話了 2,880 萬次。等於有人開了兩萬多個分身，沒日沒夜地榨取 Claude 的回答來餵自己的模型。

Anthropic 要求參議院出手：對這類行為祭出罰則、加強出口管制、替模型 IP 建立法律保護。參議員 Bill Hagerty 和 Andy Kim 已經在推動把相關制裁塞進國防法案。

怎麼看：這是 Fable 5 故事的另一面。一邊是美國政府用出口管制把自家模型鎖住（怕外流），一邊是 Anthropic 喊「中國正在大規模偷我們的能力」。兩件事拼起來，就是 2026 年 AI 產業的主旋律——模型能力本身已經被當成國安資產在攻防。順帶一提，今年二月 Anthropic 就點名過 DeepSeek、Moonshot、MiniMax 三家在做類似的事，這次只是規模升級。

來源：CNBC — Anthropic accuses Alibaba of campaign to 'brazenly' and 'illicitly' extract AI capabilities | Nikkei Asia — Anthropic accuses Alibaba of 'largest known distillation attack' on Claude | TechTimes — Alibaba Ran Largest Known AI Theft Campaign Against Claude

中國 Zhipu 的 GLM-5.2：趁美國模型被綁手，開源追到只差一個身位

美國忙著把自己的模型鎖起來，中國這邊直接把最強的開源丟給全世界免費下載。

中國 AI 公司 Zhipu（智譜，現名 Z.ai） 6/13 釋出開源權重模型 GLM-5.2，這幾天的後續評測讓矽谷再次坐直身體。

數字會說話：在一個受關注的 agentic 標竿上，GLM-5.2 跟 Anthropic 的 Opus 4.8 只差不到一個百分點，但價格只要五分之一。在 Intelligence Index v4.1 上它拿 51 分，把 MiniMax-M3（44）、DeepSeek V4 Pro（44）、Kimi K2.6（43）全甩在後面。透過 OpenRouter 這類平台，它的價格大約是每百萬 token 輸入 $1.40／輸出 $4.40——對照 GPT-5.5 的 $5／$30、Claude Opus 的 $5／$25，便宜得很有感。

最關鍵的是時機。GLM-5.2 用 MIT 授權完全開源，誰都能下載、微調、在自己機器上跑，不用任何審批。而它丟出來的這個檔口，正好是——美國政府用出口管制把 Fable 5、Mythos 5 從廣泛存取下架，又要求 OpenAI 把 GPT-5.6 限縮給政府核准的夥伴。美國前沿模型自己卡在閘門後面，中國開源直接無門檻放行。

怎麼看：這就是上面那則 tokenmaxxing 退燒故事的供給端。當企業開始算錢、又有一個「便宜五倍、能力差不多、還能自己架」的選項擺在眼前，DeepSeek 和 GLM 的吸引力只會越來越大。美國的出口管制本意是卡住中國，但短期內反而可能把市場推向中國的開源模型——這是政策設計者大概沒料到的副作用。

來源：CNBC — China's Zhipu is closing in on top U.S. AI models with Anthropic and OpenAI held back | China-Global South — After Anthropic Shutdown, China's Z.ai Closes Frontier Gap | TrendingTopics — GLM-5.2: China's Zhipu AI Beats Even Google's Top Models

Patronus AI 募 5,000 萬美元，要用「數位世界模型」幫 AI agent 練功

大家都在做 AI agent，但有人發現——agent 最缺的不是更聰明的腦，是一個能讓它反覆犯錯、再學乖的練習場。

AI 評測公司 Patronus AI 6/25 宣布完成 5,000 萬美元（約新台幣 16 億）的 Series B，由 Greenfield Partners 領投，Lightspeed、Datadog、Samsung 等都有參與，累計募資來到 7,000 萬美元（約新台幣 22 億）。

重點不在錢，在它同時發表的新產品：Digital World Models（數位世界模型）。

白話講這是什麼：它是一種大規模模擬環境——把真實的數位工作流程（比方一整套客服系統、一個企業後台）做成一個逼真的「沙盒」，讓 AI agent 在裡面練習。agent 可以在這裡踩到各種邊緣狀況、搞砸、再從失敗中學會怎麼處理。等於是給 agent 蓋了一座駕訓場，讓它在上路前先把該撞的牆都撞過一遍。

Patronus 過去一年營收成長超過 15 倍，反映企業對「怎麼確認 agent 真的可靠」的需求正在爆發。

怎麼看：這呼應了今年 agent 領域一個越來越明顯的共識——模型夠強之後，瓶頸就變成「怎麼測它、怎麼讓它在真實任務裡不出包」。OpenAI 的 GPT-5.6 主打 subagent 並行、Anthropic 的 Claude Code 有 Dynamic Workflows，大家都在堆 agent 能力；但能力越強，「上線前怎麼確保它不闖禍」就越值錢。Patronus 押的就是這條評測與模擬的賽道。

來源：PR Newswire — Patronus AI Raises $50 Million Series B and Unveils First Digital World Models | Patronus AI — Announcing our $50M Series B | BigDATAwire — Patronus AI Raises $50M Series B

後續 - Fable 5 第 16 天：還是「零流量」，解禁的唯一縫隙指向 7/8

追了兩週的 Fable 5，今天的狀態一句話講完——還是全鎖死。

從 6/12 被美國政府下令下架到今天（6/28），Fable 5 已經滿 16 天，Anthropic 對 Fable 和 Mythos 兩款模型服務的流量依然是精確的「零」。

但有一條縫隙越來越清楚。AI 沙皇 David Sacks（大衛·薩克斯）說解法其實很單純：Anthropic 修好那個被政府認定的漏洞，出口管制就解除。 而 Anthropic 已更新隱私政策、7/8 生效，開始蒐集政府核發的身分證件和生物辨識資料。

外界普遍解讀：這就是**「只開放給美國公民」的技術路徑**——不用完全解除出口管制，而是靠身分驗證把外國人擋在門外，先讓美國用戶用回來。

怎麼看：對照今天前兩則新聞，Fable 5 的處境格外諷刺。它被鎖的這 16 天裡，中國的 GLM-5.2 開源放行、Alibaba 被控大舉偷學 Claude——美國一邊擔心模型外流，一邊把自家最強模型關在門後，結果讓出了一塊市場。7/8 會不會是轉折點，下週就知道。

來源：explainx.ai — Is Fable 5 Back? No — Day 15 (June 27) | Anthropic — Statement on suspending access to Fable 5 and Mythos 5 | The New Stack — Fable 5 ban: 4 open models responded before Anthropic could restore access

值得關注

DeepSeek 把降價變永久：DeepSeek 把五月那波 75% 的促銷降價直接做成常態，V4-Pro 落在每百萬 token 輸入約 $0.44／輸出約 $0.87，大幅低於 GPT-5.5 和 Gemini 3.5 Flash。搭配今天的 tokenmaxxing 退燒和 Lindy 換供應商一起看——便宜模型正在用價格戰逼整個市場重新算帳。
Antigravity CLI 取代 Gemini CLI：Google 從 6/18 起，個人用戶的 Gemini CLI 由 Antigravity CLI 接手（企業 Vertex AI 端點不受影響）。如果你的 CI 映像檔裡有 Gemini CLI 的安裝腳本，記得趁早更新，免得哪天突然壞掉。
本週融資仍在噴：6/24 一輪就有 Assort Health（醫療 AI）募 1.2 億、Taktile（風控決策）募 1.1 億、Redo 募 8,100 萬美元；6/23 Engram 種子輪就拿 9,800 萬。錢還是大把往 AI 倒，只是流向越來越集中在「有明確商業場景」的應用層。
AI 著作權官司累計索賠破 500 億美元：目前全美 70 多起 AI 著作權訴訟在跑，累計索賠金額已超過 500 億美元。Anthropic 的 Bartz 案以 15 億美元和解（史上最大著作權賠償），Meta 則被 Scott Turow 等出版社聯合提告。模型怎麼訓練、用了誰的資料，正在從技術問題變成天價法律問題。