每日精選 AI/Tech 新聞,繁體中文整理
📍 今日全焦點
- tokenmaxxing 退燒了 — 企業不再無腦砸 AI 預算,Lindy 全面棄 Claude 改用 DeepSeek 省下數百萬美元,Uber 四個月燒光整年額度後開始設限
- Anthropic 開戰指控 Alibaba — 致信美國參議院,控 Qwen 用 2.5 萬假帳號、2,880 萬次對話偷 Claude 能力,稱「史上最大蒸餾攻擊」
- 中國 Zhipu 趁亂逼近頂尖 — GLM-5.2 開源、跑分咬住 Opus 4.8,價格只要五分之一,正好踩在美國模型被綁手的空檔
- Patronus AI 募 5,000 萬美元 — 推「數位世界模型」,要用模擬環境訓練 AI agent,押注 agent 可靠度這條賽道
- 後續 - Fable 5 第 16 天 — 仍是精確的「零流量」,7/8 生物辨識驗證上線可能是美國公民解禁的唯一出口
今日頭條
Uber 花了四個月,把一整年的 AI 預算燒光。然後它做了一件去年沒人會做的事——開始管員工用 AI 的開銷。
過去一年多,矽谷流行一個詞叫 tokenmaxxing(直譯「token 最大化」——公司鼓勵工程師盡量多用 AI、用好用滿,不太管成本,反正先衝生產力再說)。現在這個時代正在退場。
CNBC 6/26 的報導點出一個轉折:企業開始斤斤計較 AI 的每一分錢。
最有畫面的例子是 Uber。今年四月,Uber 技術長公開承認,公司在四個月內就把整年的 AI 預算燒光了。結果就是現在它對部分 AI 工具設了分級額度——基本盤每人每月 1,500 美元(約新台幣 4.8 萬),要更多得另外申請。
更狠的是 AI agent 新創 Lindy。它的執行長直接把全部流量從 Anthropic 的 Claude 搬到 DeepSeek(中國的開源權重模型,便宜很多),預估幾個月內省下數百萬美元。一個重度用 Claude 的公司,說換就換。
這跟你有什麼關係:如果你是工程師,過去那種「反正公司付錢,AI 隨便用」的好日子可能要收尾了;如果你做的是 AI 產品,客戶會開始問「我為什麼要付這麼多 token 錢」。
怎麼看:這件事的時機很微妙。OpenAI 和 Anthropic 都正在衝 IPO,最不想看到的就是「大客戶縮手」的故事——偏偏這故事現在開始發生了。一位分析師講得直白:他擔心的是最大的那些企業客戶,開始要管自己失控的 token 開銷。
便宜、開源、夠用的模型(DeepSeek、GLM)正好接住這股需求。這不只是省錢,是整個市場從「比誰最強」慢慢轉向「比誰最划算」——而這個轉向,對美國兩強的估值故事不是好消息。
新聞摘要
Anthropic 致信參議院:Alibaba 用 2.5 萬假帳號發動「史上最大蒸餾攻擊」
這則是 AI 版的工業間諜案——只是偷的不是圖紙,是模型的「腦袋」。
Anthropic 寄了一封日期 6/10 的信給美國參議院銀行委員會,指控與 Alibaba(阿里巴巴)旗下 Qwen AI 實驗室有關的人馬,對 Claude 發動了「史上規模最大」的蒸餾攻擊(distillation attack)。
先解釋什麼是蒸餾攻擊。蒸餾本來是個正常技術:用一個強模型的輸出,去訓練一個比較弱、比較小的模型,讓小模型「學會」大模型的本事。問題是——如果你拿的是別人家模型的輸出來偷學,那就變成偷竊。Anthropic 說對方就是在做這件事,鎖定 Claude 最值錢的兩塊:寫程式和 agentic 推理能力。
規模大到誇張:這波攻擊從 4/22 跑到 6/5,動用約 25,000 個假帳號,總共跟 Claude 對話了 2,880 萬次。等於有人開了兩萬多個分身,沒日沒夜地榨取 Claude 的回答來餵自己的模型。
Anthropic 要求參議院出手:對這類行為祭出罰則、加強出口管制、替模型 IP 建立法律保護。參議員 Bill Hagerty 和 Andy Kim 已經在推動把相關制裁塞進國防法案。
怎麼看:這是 Fable 5 故事的另一面。一邊是美國政府用出口管制把自家模型鎖住(怕外流),一邊是 Anthropic 喊「中國正在大規模偷我們的能力」。兩件事拼起來,就是 2026 年 AI 產業的主旋律——模型能力本身已經被當成國安資產在攻防。順帶一提,今年二月 Anthropic 就點名過 DeepSeek、Moonshot、MiniMax 三家在做類似的事,這次只是規模升級。
中國 Zhipu 的 GLM-5.2:趁美國模型被綁手,開源追到只差一個身位
美國忙著把自己的模型鎖起來,中國這邊直接把最強的開源丟給全世界免費下載。
中國 AI 公司 Zhipu(智譜,現名 Z.ai) 6/13 釋出開源權重模型 GLM-5.2,這幾天的後續評測讓矽谷再次坐直身體。
數字會說話:在一個受關注的 agentic 標竿上,GLM-5.2 跟 Anthropic 的 Opus 4.8 只差不到一個百分點,但價格只要五分之一。在 Intelligence Index v4.1 上它拿 51 分,把 MiniMax-M3(44)、DeepSeek V4 Pro(44)、Kimi K2.6(43)全甩在後面。透過 OpenRouter 這類平台,它的價格大約是每百萬 token 輸入 $1.40/輸出 $4.40——對照 GPT-5.5 的 $5/$30、Claude Opus 的 $5/$25,便宜得很有感。
最關鍵的是時機。GLM-5.2 用 MIT 授權完全開源,誰都能下載、微調、在自己機器上跑,不用任何審批。而它丟出來的這個檔口,正好是——美國政府用出口管制把 Fable 5、Mythos 5 從廣泛存取下架,又要求 OpenAI 把 GPT-5.6 限縮給政府核准的夥伴。美國前沿模型自己卡在閘門後面,中國開源直接無門檻放行。
怎麼看:這就是上面那則 tokenmaxxing 退燒故事的供給端。當企業開始算錢、又有一個「便宜五倍、能力差不多、還能自己架」的選項擺在眼前,DeepSeek 和 GLM 的吸引力只會越來越大。美國的出口管制本意是卡住中國,但短期內反而可能把市場推向中國的開源模型——這是政策設計者大概沒料到的副作用。
Patronus AI 募 5,000 萬美元,要用「數位世界模型」幫 AI agent 練功
大家都在做 AI agent,但有人發現——agent 最缺的不是更聰明的腦,是一個能讓它反覆犯錯、再學乖的練習場。
AI 評測公司 Patronus AI 6/25 宣布完成 5,000 萬美元(約新台幣 16 億)的 Series B,由 Greenfield Partners 領投,Lightspeed、Datadog、Samsung 等都有參與,累計募資來到 7,000 萬美元(約新台幣 22 億)。
重點不在錢,在它同時發表的新產品:Digital World Models(數位世界模型)。
白話講這是什麼:它是一種大規模模擬環境——把真實的數位工作流程(比方一整套客服系統、一個企業後台)做成一個逼真的「沙盒」,讓 AI agent 在裡面練習。agent 可以在這裡踩到各種邊緣狀況、搞砸、再從失敗中學會怎麼處理。等於是給 agent 蓋了一座駕訓場,讓它在上路前先把該撞的牆都撞過一遍。
Patronus 過去一年營收成長超過 15 倍,反映企業對「怎麼確認 agent 真的可靠」的需求正在爆發。
怎麼看:這呼應了今年 agent 領域一個越來越明顯的共識——模型夠強之後,瓶頸就變成「怎麼測它、怎麼讓它在真實任務裡不出包」。OpenAI 的 GPT-5.6 主打 subagent 並行、Anthropic 的 Claude Code 有 Dynamic Workflows,大家都在堆 agent 能力;但能力越強,「上線前怎麼確保它不闖禍」就越值錢。Patronus 押的就是這條評測與模擬的賽道。
後續 - Fable 5 第 16 天:還是「零流量」,解禁的唯一縫隙指向 7/8
追了兩週的 Fable 5,今天的狀態一句話講完——還是全鎖死。
從 6/12 被美國政府下令下架到今天(6/28),Fable 5 已經滿 16 天,Anthropic 對 Fable 和 Mythos 兩款模型服務的流量依然是精確的「零」。
但有一條縫隙越來越清楚。AI 沙皇 David Sacks(大衛·薩克斯)說解法其實很單純:Anthropic 修好那個被政府認定的漏洞,出口管制就解除。 而 Anthropic 已更新隱私政策、7/8 生效,開始蒐集政府核發的身分證件和生物辨識資料。
外界普遍解讀:這就是**「只開放給美國公民」的技術路徑**——不用完全解除出口管制,而是靠身分驗證把外國人擋在門外,先讓美國用戶用回來。
怎麼看:對照今天前兩則新聞,Fable 5 的處境格外諷刺。它被鎖的這 16 天裡,中國的 GLM-5.2 開源放行、Alibaba 被控大舉偷學 Claude——美國一邊擔心模型外流,一邊把自家最強模型關在門後,結果讓出了一塊市場。7/8 會不會是轉折點,下週就知道。
值得關注
- DeepSeek 把降價變永久:DeepSeek 把五月那波 75% 的促銷降價直接做成常態,V4-Pro 落在每百萬 token 輸入約 $0.44/輸出約 $0.87,大幅低於 GPT-5.5 和 Gemini 3.5 Flash。搭配今天的 tokenmaxxing 退燒和 Lindy 換供應商一起看——便宜模型正在用價格戰逼整個市場重新算帳。
- Antigravity CLI 取代 Gemini CLI:Google 從 6/18 起,個人用戶的 Gemini CLI 由 Antigravity CLI 接手(企業 Vertex AI 端點不受影響)。如果你的 CI 映像檔裡有 Gemini CLI 的安裝腳本,記得趁早更新,免得哪天突然壞掉。
- 本週融資仍在噴:6/24 一輪就有 Assort Health(醫療 AI)募 1.2 億、Taktile(風控決策)募 1.1 億、Redo 募 8,100 萬美元;6/23 Engram 種子輪就拿 9,800 萬。錢還是大把往 AI 倒,只是流向越來越集中在「有明確商業場景」的應用層。
- AI 著作權官司累計索賠破 500 億美元:目前全美 70 多起 AI 著作權訴訟在跑,累計索賠金額已超過 500 億美元。Anthropic 的 Bartz 案以 15 億美元和解(史上最大著作權賠償),Meta 則被 Scott Turow 等出版社聯合提告。模型怎麼訓練、用了誰的資料,正在從技術問題變成天價法律問題。