AI 日報 — 2026-04-17

每日精選 AI/Tech 新聞，繁體中文整理

今日頭條

Claude Opus 4.7 上線：SWE-bench 87.6% 打趴 GPT-5.4 和 Gemini 3.1 Pro，而且定價不變

欸這個每次出新 Opus 都要重寫一次排行榜啊。

Anthropic 在 4/16 正式發布 Claude Opus 4.7，一般用戶和 API 都已經可以用，同步上架 Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 三大雲。

這次的重點是「真的變強了」，不是新增功能。程式相關 benchmark 全線升級：SWE-bench Verified 從 80.8% 拉到 87.6%、Terminal-Bench 2.0 從 65.4% 到 69.4%、GPQA Diamond 從 91.3% 到 94.2%。

Opus 4.7 在 SWE-bench 上超越了 GPT-5.4 和 Gemini 3.1 Pro，重新拿回最強程式模型的位子。Anthropic 說這版模型「能處理長時間、複雜的工作流程，會自己驗證輸出再回報」——翻譯一下就是：AI Agent 自主跑更久也比較不會歪。

另一個第一次：高解析度視覺。最大解析度從 1,568 像素拉到 2,576 像素，影像處理預算從 1.15 MP 三倍到 3.75 MP。以前 Claude 在讀 UI 截圖、手寫筆記、長截圖時會糊掉，這版該解決了。

定價維持 $5/$25 per M Tokens（輸入/輸出），跟 Opus 4.6 一樣——但換了新 tokenizer，同樣內容可能吃 1.0–1.35 倍 Token，實際成本要重新估。

另一個同步上線的是 Auto Mode（自動模式）：Max 訂閱戶和 API 用戶用 Opus 4.7 時可開，Claude Code 會自行判斷哪些指令安全可直接跑、哪些要問人。重度用戶值得試但要設好範圍。

至於為什麼不是 Mythos？Anthropic 明講了：Opus 4.7 的攻擊面能力刻意不如 Mythos Preview，並內建自動偵測高風險資安指令的 guardrail。這是 Project Glasswing 之外的「安全版」路徑。

來源：Anthropic 官方（4/16）／CNBC（4/16）／The Next Web（4/16）／AWS（4/16）

新聞摘要

OpenAI Agents SDK 大改版：原生 sandbox、Codex 級檔案操作、可配置記憶

如果你在做 AI Agent 產品，這波更新要看。

4/15–16，OpenAI 發布 Agents SDK（Agent 開發工具包）重大升級——官方描述是「Agents SDK 的下一次進化」。

最大變化是原生 sandbox 執行：Agent 在隔離環境跑程式、操作檔案，不會直接碰到主機系統的敏感資源。這解決了企業一直擔心的「Agent 會不會亂改我的東西」問題。

其他新增能力：

配置式記憶：可以指定 Agent 記什麼、記多久
Codex 級 filesystem 工具：操作檔案像 Codex（OpenAI 的程式 Agent）一樣細
可攜式工作區：Agent 跨 session 繼續工作不掉狀態
內建 snapshot：長時間任務可以在任意點 resume

SDK 新能力全部透過標準 API 開放，不需要額外付費分層。先上 Python，TypeScript 稍後跟上。

這是 OpenAI 把 Agent 開發門檻往下拉的大動作。對照 Anthropic 這週也在強推 Claude Code Routines，兩家的邏輯類似：讓 Agent 從 demo 變成可上生產。

來源：OpenAI 官方 Blog（4/15）／TechCrunch（4/15）／Help Net Security（4/16）

後續：Anthropic 被 VC 以 $800 億美元估值追求，選擇先不收（目前）

一天接到的投資意向金額，比多數國家一年的 AI 預算還大。

延續 4/16 頭條的 $300 億 ARR 故事，Bloomberg 和 Business Insider 4/14–15 揭露更完整的後續：多家 VC 主動向 Anthropic 提出新一輪融資，估值上看 $800 億美元（約新台幣 2.56 兆元）。

對比一下：今年 2 月 Anthropic 完成的 $30 億美元融資，投前估值是 $350 億美元——兩個月不到，投資人願意出的價格翻了兩倍多。

Anthropic 目前選擇不收。公司沒有關閉融資選項，但對 $800 億這個價格沒點頭。知情人士對 TechCrunch 表示，Anthropic 內部正在評估「今年稍後 IPO」的路徑，不急著簽私募新輪。

為什麼敢這麼硬？ARR 從去年底 $90 億暴衝到 $300 億，四個月 3 倍成長，加上 Opus 4.7 這週發、和 Google/Broadcom 的 TPU 擴產案都已落地——基本面撐得起再等一下。

OpenAI 估值 $852 億美元仍是目前最高，但 Anthropic 如果真的接受 $800 億這個價格，AI 雙雄的估值差距就會拉到只剩個位數百分比。

來源：Bloomberg（4/14）／TechCrunch（4/15）／The Next Web（4/15）

Upscale AI 洽談第三輪融資，$2B 估值——產品還沒出就先漲六倍

有時候矽谷融資像接力賽，跑的是「還有人願意跟嗎」。

4/16 Bloomberg 和 TechCrunch 報導：AI 基礎設施新創 Upscale AI 正在洽談新一輪融資，目標金額 $1.8–2 億美元（約新台幣 58–64 億元），估值約 $20 億美元（約新台幣 640 億元）。

重點是時間軸。這家公司成立才 7 個月：

2025 年 9 月：$1 億美元 seed round
2026 年 1 月：$2 億美元 Series A（估值 $10 億）
2026 年 4 月：洽談 Series B（估值 $20 億）

三輪融資，估值漲 6 倍，而且到現在連產品都還沒發布。主要投資人是 Tiger Global Management、Xora Innovation、Premji Invest。

Upscale AI 做什麼？自製 AI 晶片 + 晶片互聯基礎設施——跟 Cisco、Broadcom 正面打的領域。他們的賭注是「全堆疊方案 + 開放標準」會贏專有架構。

這種「預期定價」已經是 2026 年頭部 AI 基礎設施領域的常態。Q1 全球創投資金 $3,000 億美元裡，AI 佔 $2,420 億（80%）——錢太多，產品還在 PPT 階段的公司也拿得到高估值。

來源：Bloomberg（4/16）／TechCrunch（4/16）

阿里巴巴發布 Qwen3.6-35B-A3B：開源、輕量、瞄準 Agent Coding

同一天 Claude Opus 4.7 出場的背景音，是中國這邊的開源正在追。

4/16，阿里巴巴 Qwen 團隊 在 Hugging Face 和 ModelScope 發布 Qwen3.6-35B-A3B，採 Apache 2.0 授權（可商用）。

模型架構的重點：MoE（混合專家模型），總參數 350 億，活躍參數僅 30 億。直白講：紙面規格看起來是 35B 等級，實際推理時只啟動 3B，跑起來比看起來輕很多——這代表單張 GPU 就能本地部署，對企業或獨立開發者極友善。

官方宣稱的強項：

SWE-bench 和 Terminal-Bench 上超越前代 Qwen3.5-35B-A3B
Gemma 4-31B 在多項 benchmark 上被超過
原生多模態（文字、圖像、聲音）
支援「thinking / non-thinking」雙模式——要推理就開，要快就關

這個定位很清楚：主攻 Agentic Coding（代理型程式開發）。不跟 Opus/GPT 正面拚頂尖能力，走「夠好 + 開源 + 輕量」路線，讓不想付 Token 錢、或資料不能出雲的團隊有選擇。

Alibaba Cloud 的 Bailian 平台之後也會提供 API，且相容 OpenAI 和 Anthropic 的協議——直接讓現有客戶無痛切換。

來源：Qwen 官方（4/16）／OfficeChai（4/16）／PANews（4/16）

Google Gemini Personal Intelligence 全球開放——AI 讀你 Gmail、相簿、搜尋紀錄

Gemini 變得更了解你，也順便讓更多人開始擔心隱私。

4/15，Google 宣布 Gemini Personal Intelligence（個人智慧）全球開放給 Google AI Ultra、Pro、Plus 訂閱用戶使用，免費用戶稍後上線。

功能核心：讓 Gemini 掃描你的 Gmail、Google Photos、Google Search 歷史、YouTube 觀看紀錄，把這些資料變成「你」的上下文。問它「我上週那個 Amazon 訂單什麼時候到」或「我跟小美約的那間餐廳叫什麼」都能答得出來——因為它真的看過。

實際應用情境：

幫忙整理未讀信、抓出需要回的重要 email
根據你的相簿內容做相片整理或搜尋（「上個月日本旅行的那張櫻花」）
結合搜尋歷史給個人化的研究或購物建議

資料處理方式：Google 強調所有資料都在你的 Google 帳號生態裡處理，但具體 retention 和是否用於訓練，官方頁面敘述仍偏抽象。要不要開這個功能，值得想清楚資料授權範圍。

這波策略的意義：Google 在 Mac 端（Gemini 原生 App，4/15 上線）和 Chrome 端（Skills，4/14 上線）之後，補完了「個人資料層」。對比 OpenAI 靠收購 Hiro Finance 進入個人金融、Anthropic 走企業端路線，Google 選的是「把自家資料優勢放大」這條路。

來源：Tech Advisor（4/15）／9to5Google（4/11）

值得關注

OpenAI Spud 發布窗口第四天：3/24 預訓練完成後的 21–42 天窗口內，今天是第 24 天。Polymarket 給 4/30 前發布機率 78%。Anthropic 剛丟出 Opus 4.7 搶頭條，OpenAI 這邊壓力再往上疊一層。

Musk vs OpenAI 4/27 開庭倒計時 10 天：陪審團遴選 4/27 在奧克蘭聯邦法院開始。Musk 本週仍在補訴求變更文件（從索賠改要求撤換 Altman + 撤銷營利轉型）。審理預計 4 週，是今年最受關注的 AI 治理法律案。

Anthropic vs 五角大廈 5/19 口頭辯論：DC 聯邦上訴法院和第九巡迴的相反裁決尚未統一，5/19 是最近的釐清機會。結果會影響所有 AI 公司接政府合約的態度。

xAI vs 科羅拉多 6/30 大限：CPAI 法（AI 消費者保護法）6/30 生效，xAI 爭取在此之前拿到禁制令。若失敗可上訴第十巡迴。各州 AI 法規的空間會被這場官司定調。

Anthropic 董事會結構轉折：4/14 Novartis 執行長 Vas Narasimhan 加入董事會，Long-Term Benefit Trust（長期利益信託）選派的董事首次超過半數。這代表 Anthropic 的治理結構正式進入「公益信託主導」階段，對估值和 IPO 路徑都是新變數。

Claude Opus 4.7 + Mythos 共存策略成形：這週 Opus 4.7（GA 普版）和 Mythos（Glasswing 限定版）兩條產品線同時推進，Anthropic 明顯在把「商業化 AI」和「高風險能力 AI」切開管理——這可能成為前沿實驗室的新常態。