Lukeverstopia
📰 Look AI 一分鐘

AI 日報 — 2026-04-13

每日精選 AI/Tech 新聞,繁體中文整理


今日頭條

被點名盜模型的 MiniMax,昨天開源了一個「自己造自己」的 AI

欸,這個時間點真的很有意思。

就在上週(4/6),OpenAI、Anthropic、Google 聯手對外宣布:三家合計記錄到中國 AI 公司透過「對抗性蒸餾(Adversarial Distillation)」——也就是用大量精心設計的 Prompt 向目標 LLM 榨取知識來訓練自家模型——的行為。Anthropic 一家就文件化了 1,600 萬次未授權查詢,來自大約 2.4 萬個偽造帳號,三家被點名的中國 AI 公司分別是 DeepSeek、Moonshot AI(月之暗面)和 MiniMax

然後昨天,MiniMax 把自家最新旗艦模型 M2.7 的權重全部開源了

MiniMax M2.7 最早在 3 月 18 日以閉源形式發布。昨天(4/12),MiniMax 把完整模型權重公開到 Hugging Face,採 MIT 授權,任何人都可以自由下載、修改、商用。

但這個模型本身的技術故事比時間點更值得講。M2.7 有一個別的模型沒有的標籤:它參與了自己的開發。MiniMax 讓 M2.7 自主執行了超過 **100 輪「分析失敗→規劃改動→修改架構→跑評測→比對結果→決定要保留還是回退」**的迭代循環,最終在內部評測集上提升了 30% 效能。他們把這個流程叫「自我進化(Self-Evolution)」。

成果可以量化:

  • SWE-Pro(模擬真實跨語言軟體工程任務的 AI 評測基準):56.22%,與 GPT-5.3-Codex 持平
  • Terminal Bench 2(在真實終端機環境中完成任務的評測基準):57.0%
  • GDPval-AA(複雜辦公室任務評測,涵蓋 Excel/Word/PPT):ELO 1495,開源模型第一名

對開發者來說,「開源 + 能做複雜辦公室任務 + 軟體工程能力接近 GPT-5.3-Codex」這個組合是實質選項。MiniMax 也順便開源了一個叫 OpenRoom 的 GUI 互動 demo(大部分程式碼由 M2.7 自己寫的)。

來源:MarkTechPost(4/12)/VentureBeat(4/12)/MiniMax 官方(4/12)


新聞摘要

Anthropic 進軍 Microsoft Word——Claude 現在可以直接在你的 .docx 裡幫你改稿

法律產業是 Anthropic 的下一個主戰場,而 Word 是那個主戰場的地盤。

4/10-11,Anthropic 正式推出 Claude for Word(公開測試版),以 Microsoft AppSource 的 Word 側邊欄 Add-in 形式發布,Mac 和 Windows 都支援。

功能很直接:在 Word 裡打開 Claude 側邊欄,就能要求它起草、潤稿、修改、追蹤變更(tracked changes)——不用離開文件、不用複製貼上。更值得注意的是跨應用連動:Claude for Word 能跟 Claude for ExcelClaude for PowerPoint 共享同一個對話 session。也就是說,你可以叫 Claude 對照 Excel 財務模型確認 Word 報告裡的數字有沒有對不上,或是讓 Word 敘述跟 PowerPoint 簡報用語一致,一次搞定。

首要目標客群是法律業。Dario Amodei(Anthropic 共同創辦人暨執行長)最近在倫敦路演,直接點名法律是 Claude for Word 的核心使用情境。全球法律服務市場規模約 $1 兆美元,Anthropic 顯然是認真的。

目前 Claude for Word 只開放給 Team 方案($25/人/月)和 Enterprise 用戶,免費和 Pro 方案暫不支援。

來源:The Next Web(4/11)/Artificial Lawyer(4/11)/CybersecurityNews(4/11)


Google AI Mode 開始幫你在英國和印度訂餐廳——AI 搜尋從「找資訊」跨到「採取行動」

AI 搜尋的下一步不是更好的回答,是直接替你做事。這件事昨天有了新進展。

4/10,Google 正式在 AI Mode in Search 裡上線了自主餐廳訂位功能,首波展開地區包括英國和印度,接著擴展到澳洲、加拿大、香港、新加坡、南非和紐西蘭。

操作方式是純自然語言:你說「幫我在倫敦 Shoreditch 找一間可以帶狗的義大利餐廳,周六晚上七點,兩個人」,AI Mode 就會幫你查可用時段、比對評價,直接完成預訂——全程不用進任何餐廳網站,不用填表單。整合的訂位平台包括 TheFork、Resdiary 等主流系統。

這個功能同時配合 AI Mode 介面改版(Google 稱之為「Plus 設計」),讓 Prompt 輸入框和搜尋結果的排版更接近 Agent 操作介面而非傳統搜尋框。

這個時間點很值得注意:AI 搜尋從「給你答案」跨到「替你完成操作」,一直是業界討論了很久的方向。Google 現在在真實世界的訂位流程上實現了這一步,且是非 Labs、直接面向一般用戶的功能——不是測試,是正式上線。

來源:9to5Google(4/10)/Google 官方 Blog(4/10)


OpenAI 喊停英國 Stargate——電費太貴,IPO 前先收手

OpenAI 的版圖擴張踩煞車了,而且那個煞車叫「英國電費」。

4/9,Bloomberg、CNBC、The Register 同步報導:OpenAI 暫停英國 Stargate 資料中心計畫。這個計畫去年 9 月宣布,與 NvidiaNscale 合作,原本計畫 2026 Q1 先部署 8,000 個 GPU,長期擴展到 31,000 個 GPU。現在整個喊停。

原因有兩個:英國工業電費是已開發國家中最高的之一,加上版權規範仍在混沌中(英國正在討論 AI 訓練用版權素材的使用限制)。OpenAI 發言人說:「等到能源成本和法規能支持長期基礎設施投資時,我們會繼續探討 Stargate UK。」

更大的背景是 IPO。《Bloomberg》的說法是:OpenAI 在「為高度期待的上市收緊雄心勃勃的支出計畫」。CFO Sarah Friar 上週才私下表示公司「沒準備好」2026 年 IPO,現在連海外擴張都開始踩煞車——幾件事放在一起看,現在 OpenAI 的財務優先序列非常清楚:要 IPO,所以要有好看的成本控制

對英國政府來說,這個消息不太好聽。UK 的 AI 戰略很大程度押注在吸引美國 AI 大廠部署算力,OpenAI 退場是一個訊號。

來源:Bloomberg(4/9)/CNBC(4/9)/The Register(4/9)


Shopify 開源 AI Toolkit——你的 Claude Code 現在可以幫你管整家電商

第一個把整家店的操作權交給 AI Agent 的主流平台,昨天悄悄到來了。

4/9,Shopify 在 GitHub 開源了 Shopify AI Toolkit(MIT 授權),讓 Claude Code、OpenAI Codex、Cursor、Gemini CLI、VS Code 等 AI 編程工具,可以用自然語言直接管理 Shopify 商店——新增商品、更新庫存、調整定價、執行後台操作——全部不需要登入 Shopify 後台。

安裝很快:Claude Code 裡兩個指令,或 Cursor 一個點擊。Toolkit 打包了 16 個 Skill 檔案,每個涵蓋 Shopify 平台的不同功能模組,還提供即時 API schema 驗證,讓 AI 執行前知道操作是否符合現行 Shopify API 規範。

最值得注意的細節shopify-admin-execution 這個 Skill 沒有內建的 Undo 機制。AI Agent 執行了什麼就是什麼,無法一鍵還原。這是設計決策,不是遺漏——Shopify 預設你(或你的 Agent)知道自己在做什麼。

這件事的意義超出「又一個 AI 工具」:這是第一次主流電商平台正式把 live store 的完整操作控制,以官方工具形式開放給外部 AI Agent。以前 AI 再聰明,要動電商後台還是要透過人工操作或私下 API hack。現在 Shopify 官方開門了。

來源:Shopify 官方 GitHub(4/9)/AlternativeTo(4/9)/nadcab(4/9)


值得關注

  • MiniMax 開源的政治時機:MiniMax 上週才剛被 Anthropic/OpenAI/Google 點名「透過對抗性蒸餾竊取模型知識」,本週就開源自家旗艦模型。這個動作很難說是純粹的技術決策——開源增加透明度、反駁「只會抄」的標籤、同時搶占開源社群心佔率,三個目的一石三鳥。後續 DeepSeek 和 Moonshot AI 會不會有類似反應,值得追蹤。
  • Anthropic Office Suite 版圖成形:Claude for Word(4/10)加上先前的 Claude for Excel、Claude for PowerPoint,Anthropic 已經悄悄在 Microsoft 整個 Office 生態裡站穩腳步。下一步可能是 Claude for Outlook 或更深度的 Teams 整合。Anthropic 走的是「企業文件工作流」這條路,跟 OpenAI 的「通用 ChatGPT 訂閱」策略形成對比。
  • Musk vs OpenAI 4/27 開庭倒計時 14 天:上週 Musk 突然改變訴求方向——從「賠我錢」改成「撤換 Altman、法院監督所有融資」。OpenAI 稱之為「法律突襲」。這週雙方應該還會有庭前文件動作,可能出現更多爆料。
  • Anthropic vs 五角大廈 5/19 口頭辯論:兩個法院現在判決相互矛盾(DC 說可以黑名單、舊金山說不行)。5/19 上訴法院的口頭辯論將決定哪個法院的命令有效。結果可能影響所有 AI 公司對政府合約的態度。
  • Shopify AI Toolkit 的「無 Undo」設計:這個設計細節值得整個 AI Agent 社群認真討論。「AI 能操作真實世界的系統」和「AI 能無法撤銷地改變真實世界的系統」之間的差距,比大多數人意識到的要小得多。