每日精選 AI/Tech 新聞,繁體中文整理
今日頭條
Claude Opus 4.7 上線:SWE-bench 87.6% 打趴 GPT-5.4 和 Gemini 3.1 Pro,而且定價不變
欸這個每次出新 Opus 都要重寫一次排行榜啊。
Anthropic 在 4/16 正式發布 Claude Opus 4.7,一般用戶和 API 都已經可以用,同步上架 Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 三大雲。
這次的重點是「真的變強了」,不是新增功能。程式相關 benchmark 全線升級:SWE-bench Verified 從 80.8% 拉到 87.6%、Terminal-Bench 2.0 從 65.4% 到 69.4%、GPQA Diamond 從 91.3% 到 94.2%。
Opus 4.7 在 SWE-bench 上超越了 GPT-5.4 和 Gemini 3.1 Pro,重新拿回最強程式模型的位子。Anthropic 說這版模型「能處理長時間、複雜的工作流程,會自己驗證輸出再回報」——翻譯一下就是:AI Agent 自主跑更久也比較不會歪。
另一個第一次:高解析度視覺。最大解析度從 1,568 像素拉到 2,576 像素,影像處理預算從 1.15 MP 三倍到 3.75 MP。以前 Claude 在讀 UI 截圖、手寫筆記、長截圖時會糊掉,這版該解決了。
定價維持 $5/$25 per M Tokens(輸入/輸出),跟 Opus 4.6 一樣——但換了新 tokenizer,同樣內容可能吃 1.0–1.35 倍 Token,實際成本要重新估。
另一個同步上線的是 Auto Mode(自動模式):Max 訂閱戶和 API 用戶用 Opus 4.7 時可開,Claude Code 會自行判斷哪些指令安全可直接跑、哪些要問人。重度用戶值得試但要設好範圍。
至於為什麼不是 Mythos?Anthropic 明講了:Opus 4.7 的攻擊面能力刻意不如 Mythos Preview,並內建自動偵測高風險資安指令的 guardrail。這是 Project Glasswing 之外的「安全版」路徑。
來源:Anthropic 官方(4/16)/CNBC(4/16)/The Next Web(4/16)/AWS(4/16)
新聞摘要
OpenAI Agents SDK 大改版:原生 sandbox、Codex 級檔案操作、可配置記憶
如果你在做 AI Agent 產品,這波更新要看。
4/15–16,OpenAI 發布 Agents SDK(Agent 開發工具包)重大升級——官方描述是「Agents SDK 的下一次進化」。
最大變化是原生 sandbox 執行:Agent 在隔離環境跑程式、操作檔案,不會直接碰到主機系統的敏感資源。這解決了企業一直擔心的「Agent 會不會亂改我的東西」問題。
其他新增能力:
- 配置式記憶:可以指定 Agent 記什麼、記多久
- Codex 級 filesystem 工具:操作檔案像 Codex(OpenAI 的程式 Agent)一樣細
- 可攜式工作區:Agent 跨 session 繼續工作不掉狀態
- 內建 snapshot:長時間任務可以在任意點 resume
SDK 新能力全部透過標準 API 開放,不需要額外付費分層。先上 Python,TypeScript 稍後跟上。
這是 OpenAI 把 Agent 開發門檻往下拉的大動作。對照 Anthropic 這週也在強推 Claude Code Routines,兩家的邏輯類似:讓 Agent 從 demo 變成可上生產。
來源:OpenAI 官方 Blog(4/15)/TechCrunch(4/15)/Help Net Security(4/16)
後續:Anthropic 被 VC 以 $800 億美元估值追求,選擇先不收(目前)
一天接到的投資意向金額,比多數國家一年的 AI 預算還大。
延續 4/16 頭條的 $300 億 ARR 故事,Bloomberg 和 Business Insider 4/14–15 揭露更完整的後續:多家 VC 主動向 Anthropic 提出新一輪融資,估值上看 $800 億美元(約新台幣 2.56 兆元)。
對比一下:今年 2 月 Anthropic 完成的 $30 億美元融資,投前估值是 $350 億美元——兩個月不到,投資人願意出的價格翻了兩倍多。
Anthropic 目前選擇不收。公司沒有關閉融資選項,但對 $800 億這個價格沒點頭。知情人士對 TechCrunch 表示,Anthropic 內部正在評估「今年稍後 IPO」的路徑,不急著簽私募新輪。
為什麼敢這麼硬?ARR 從去年底 $90 億暴衝到 $300 億,四個月 3 倍成長,加上 Opus 4.7 這週發、和 Google/Broadcom 的 TPU 擴產案都已落地——基本面撐得起再等一下。
OpenAI 估值 $852 億美元仍是目前最高,但 Anthropic 如果真的接受 $800 億這個價格,AI 雙雄的估值差距就會拉到只剩個位數百分比。
來源:Bloomberg(4/14)/TechCrunch(4/15)/The Next Web(4/15)
Upscale AI 洽談第三輪融資,$2B 估值——產品還沒出就先漲六倍
有時候矽谷融資像接力賽,跑的是「還有人願意跟嗎」。
4/16 Bloomberg 和 TechCrunch 報導:AI 基礎設施新創 Upscale AI 正在洽談新一輪融資,目標金額 $1.8–2 億美元(約新台幣 58–64 億元),估值約 $20 億美元(約新台幣 640 億元)。
重點是時間軸。這家公司成立才 7 個月:
- 2025 年 9 月:$1 億美元 seed round
- 2026 年 1 月:$2 億美元 Series A(估值 $10 億)
- 2026 年 4 月:洽談 Series B(估值 $20 億)
三輪融資,估值漲 6 倍,而且到現在連產品都還沒發布。主要投資人是 Tiger Global Management、Xora Innovation、Premji Invest。
Upscale AI 做什麼?自製 AI 晶片 + 晶片互聯基礎設施——跟 Cisco、Broadcom 正面打的領域。他們的賭注是「全堆疊方案 + 開放標準」會贏專有架構。
這種「預期定價」已經是 2026 年頭部 AI 基礎設施領域的常態。Q1 全球創投資金 $3,000 億美元裡,AI 佔 $2,420 億(80%)——錢太多,產品還在 PPT 階段的公司也拿得到高估值。
來源:Bloomberg(4/16)/TechCrunch(4/16)
阿里巴巴發布 Qwen3.6-35B-A3B:開源、輕量、瞄準 Agent Coding
同一天 Claude Opus 4.7 出場的背景音,是中國這邊的開源正在追。
4/16,阿里巴巴 Qwen 團隊 在 Hugging Face 和 ModelScope 發布 Qwen3.6-35B-A3B,採 Apache 2.0 授權(可商用)。
模型架構的重點:MoE(混合專家模型),總參數 350 億,活躍參數僅 30 億。直白講:紙面規格看起來是 35B 等級,實際推理時只啟動 3B,跑起來比看起來輕很多——這代表單張 GPU 就能本地部署,對企業或獨立開發者極友善。
官方宣稱的強項:
- SWE-bench 和 Terminal-Bench 上超越前代 Qwen3.5-35B-A3B
- Gemma 4-31B 在多項 benchmark 上被超過
- 原生多模態(文字、圖像、聲音)
- 支援「thinking / non-thinking」雙模式——要推理就開,要快就關
這個定位很清楚:主攻 Agentic Coding(代理型程式開發)。不跟 Opus/GPT 正面拚頂尖能力,走「夠好 + 開源 + 輕量」路線,讓不想付 Token 錢、或資料不能出雲的團隊有選擇。
Alibaba Cloud 的 Bailian 平台之後也會提供 API,且相容 OpenAI 和 Anthropic 的協議——直接讓現有客戶無痛切換。
來源:Qwen 官方(4/16)/OfficeChai(4/16)/PANews(4/16)
Google Gemini Personal Intelligence 全球開放——AI 讀你 Gmail、相簿、搜尋紀錄
Gemini 變得更了解你,也順便讓更多人開始擔心隱私。
4/15,Google 宣布 Gemini Personal Intelligence(個人智慧)全球開放給 Google AI Ultra、Pro、Plus 訂閱用戶使用,免費用戶稍後上線。
功能核心:讓 Gemini 掃描你的 Gmail、Google Photos、Google Search 歷史、YouTube 觀看紀錄,把這些資料變成「你」的上下文。問它「我上週那個 Amazon 訂單什麼時候到」或「我跟小美約的那間餐廳叫什麼」都能答得出來——因為它真的看過。
實際應用情境:
- 幫忙整理未讀信、抓出需要回的重要 email
- 根據你的相簿內容做相片整理或搜尋(「上個月日本旅行的那張櫻花」)
- 結合搜尋歷史給個人化的研究或購物建議
資料處理方式:Google 強調所有資料都在你的 Google 帳號生態裡處理,但具體 retention 和是否用於訓練,官方頁面敘述仍偏抽象。要不要開這個功能,值得想清楚資料授權範圍。
這波策略的意義:Google 在 Mac 端(Gemini 原生 App,4/15 上線)和 Chrome 端(Skills,4/14 上線)之後,補完了「個人資料層」。對比 OpenAI 靠收購 Hiro Finance 進入個人金融、Anthropic 走企業端路線,Google 選的是「把自家資料優勢放大」這條路。
來源:Tech Advisor(4/15)/9to5Google(4/11)
值得關注
- OpenAI Spud 發布窗口第四天:3/24 預訓練完成後的 21–42 天窗口內,今天是第 24 天。Polymarket 給 4/30 前發布機率 78%。Anthropic 剛丟出 Opus 4.7 搶頭條,OpenAI 這邊壓力再往上疊一層。
- Musk vs OpenAI 4/27 開庭倒計時 10 天:陪審團遴選 4/27 在奧克蘭聯邦法院開始。Musk 本週仍在補訴求變更文件(從索賠改要求撤換 Altman + 撤銷營利轉型)。審理預計 4 週,是今年最受關注的 AI 治理法律案。
- Anthropic vs 五角大廈 5/19 口頭辯論:DC 聯邦上訴法院和第九巡迴的相反裁決尚未統一,5/19 是最近的釐清機會。結果會影響所有 AI 公司接政府合約的態度。
- xAI vs 科羅拉多 6/30 大限:CPAI 法(AI 消費者保護法)6/30 生效,xAI 爭取在此之前拿到禁制令。若失敗可上訴第十巡迴。各州 AI 法規的空間會被這場官司定調。
- Anthropic 董事會結構轉折:4/14 Novartis 執行長 Vas Narasimhan 加入董事會,Long-Term Benefit Trust(長期利益信託)選派的董事首次超過半數。這代表 Anthropic 的治理結構正式進入「公益信託主導」階段,對估值和 IPO 路徑都是新變數。
- Claude Opus 4.7 + Mythos 共存策略成形:這週 Opus 4.7(GA 普版)和 Mythos(Glasswing 限定版)兩條產品線同時推進,Anthropic 明顯在把「商業化 AI」和「高風險能力 AI」切開管理——這可能成為前沿實驗室的新常態。