每日精選 AI/Tech 新聞,繁體中文整理
📍 今日全焦點
- Claude Sonnet 5 上線,還帶了 Claude Science — 逼近 Opus 4.8 的實力、四分之一的價格,直接當 Free/Pro 預設模型
- 後續 - Fable 5 第 19 天 — 預測市場賭的 7/1 解禁沒兌現,實名驗證(7/8)成了真正的回歸路徑
- Reflection AI 今天開機 — 「美版 DeepSeek」啟動每月 1.5 億美元的 SpaceX 算力合約
- AI coding 工具價格戰白熱化 — Sonnet 5 用低價 agentic 定價殺進 Copilot、Cursor、Codex 的地盤
- Anthropic 企業部署一次上齊 — Bedrock/Google Cloud gateway、Microsoft Foundry GA、遠端裝置驗證同日推出
今日頭條
七月的第一個上班日,開發者打開 Claude,發現預設模型換人了。
昨天(6/30)Anthropic 那場叫 The Briefing: AI for Science 的直播,端出來的東西比「科學展示」重得多——它順手發了一顆新模型。
主角是 Claude Sonnet 5。定位很直接:史上最會「自己動手」的 Sonnet。它能自己規劃步驟、操作瀏覽器和終端機、把一段任務從頭跑到尾——這種 agentic(自主代理式,指 AI 不只回答問題,還能連續呼叫工具、自己完成多步驟任務) 的能力,幾個月前還只有更大更貴的旗艦模型做得到。
最有感的是這組數字:Sonnet 5 的表現逼近旗艦 Opus 4.8,價格卻低一大截。
上線就給促銷價:每百萬 token 輸入 2 美元、輸出 10 美元(優惠到 8/31),之後回到 $3 / $15。對照 Opus 4.8 的 $5 / $25、Fable 5 的 $10 / $50——同一家公司,用四分之一到六分之一的價格,把接近頂規的 agentic 能力下放給所有人。而且它直接成為免費版和 Pro 版的預設模型,Max、Team、Enterprise、Claude Code、API 全部同步可用。
安全性也是這次的賣點。Anthropic 說 Sonnet 5 比前一代 Sonnet 4.6(今年二月發布)更少出現「不良行為」——像是配合惡意使用、或欺騙——也更能擋住 prompt injection(提示注入攻擊,把惡意指令藏進輸入裡騙 AI 照做)。這點對要放 agent 去自動跑任務的人特別關鍵:能力放出去了,韁繩也得抓緊。
同一天還上了 Claude Science。 這不是新模型,是一個給研究人員用的 Mac / Linux 桌面 App——把 60 多個科學資料庫和工具塞進一個工作台,用一個「協調 agent」分派任務給各路專門的子 agent,最後再派一個「審查 agent」檢查引用和計算對不對,產出的東西全部可稽核、可重跑。目前對 Pro / Max / Team / Enterprise 開 beta。
怎麼看:把這兩件事疊起來,就是這個月 Anthropic 一直在講的那條線——AI 的競爭正從「誰的模型分數高」轉向「誰能把模型變成真的把事情做完的工具」。Sonnet 5 是把 agentic 能力做便宜、做安全、做到人人可用;Claude Science 是把它裝進一個真的能交付研究成果的殼裡。對開發者來說,今天最實際的一句話是:你手上那個每天在用的 coding agent,剛剛變便宜了,也變聰明了。
新聞摘要
後續 - Fable 5 第 19 天:賭盤說的 7/1 解禁沒來,回歸的路變成「實名驗證」
追到第 19 天,劇情有個關鍵轉折——但轉的方向可能跟大家想的不一樣。
先講結果:Fable 5 到今天(7/1)還是全球下架,一般用戶、API 開發者、Claude Code、海外訂閱戶都用不到。預測市場(Kalshi、Polymarket)原本押 7/1 是解禁窗口,週末過去了,沒兌現。
卡點還是老地方:五角大廈和 NSA(美國國家安全局)的簽核還沒下來。據報導,Anthropic 這邊由共同創辦人 Tom Brown(湯姆・布朗)親自帶隊跟政府談。上週五(6/27)已經放行的是它的兄弟 Mythos 5——但只開給「Annex A」名單上約 100 家政府核准的機構,範圍沒變。
真正值得記住的是回歸的「機制」正在成形。
Anthropic 排定 7/8 更新隱私政策,要求用 Persona(一個由 Peter Thiel 投資的身份驗證平台)做政府核發證件 + 生物辨識的實名驗證。App 裡也已經冒出新字串,把 Fable 5 的使用額度綁到身份驗證上。
換句話說——Fable 5 很可能不是「解除禁令、恢復原狀」,而是「戴上實名手銬後,只放行給驗證過的美國公民」。 出口管制的行政命令不必完全撤,靠實名把外國人擋在門外,就達成政府要的效果。
怎麼看:這條線我追了快三週,今天的體感是——「無門檻自由使用」的 Fable 5 可能回不來了。 對海外(包括台灣)開發者來說,就算解禁,你我大概也在實名這關就被擋下。前兩天講的那個弔詭局面沒變、只會更明顯:美國把最強模型一個個上鎖加實名,中國的 GLM-5.2、DeepSeek 繼續無門檻放給全世界下載。管制想卡對手,短期卻可能把海外開發者推向對岸的開源。
Reflection AI 今天開機:每月 1.5 億美元,租下 SpaceX 的算力
昨天說的「美版 DeepSeek」明天啟動——今天,它真的按下開機鍵了。
開源 AI 新創 Reflection AI(由兩位前 Google DeepMind 研究員創辦、Nvidia 是投資人之一、估值約 250 億美元)從今天(7/1)起,正式啟用與 SpaceX 簽下的算力合約。
條件很硬:每月付 1.5 億美元(約新台幣 48.6 億),租用 SpaceX 位於田納西州曼菲斯的 Colossus 2 資料中心裡 Nvidia 最新的 GB300 晶片,合約跑到 2029 年,總額上看 63 億美元(約新台幣 2,040 億)。頭三個月後,任一方可提前 90 天喊停。
Reflection 的定位是做「美國自己的開源前沿模型」,對標 DeepSeek。但它目前還沒有公開模型——第一個 frontier 開源模型預計 2026 年底到 2027 年初才會問世。今天開機,等於是把幾十億美元的算力先押上桌,成果還要等大半年才驗收。
怎麼看:這件事最有意思的不是模型,是算力本身變成一門獨立生意。SpaceX 把 Colossus 從「自己用」變成「租給別人用」的算力平台,客戶名單已經有 Anthropic、Google、Cursor,現在加上 Reflection。當「開源模型能不能追上」還沒有答案時,賣鏟子的(算力供應商)已經先賺到了。
Sonnet 5 一上線,AI coding 工具的價格戰就更難打了
如果你日常用 AI 寫 code,今天的重點不只是「Claude 出新模型」,是整個工具市場的成本結構又被搖了一次。
Sonnet 5 促銷價 $2 / $10(輸入/輸出,每百萬 token),把「接近旗艦的 agentic coding」壓到 Opus-tier 的四分之一。這一刀,剛好切在幾家對手最敏感的時候:
GitHub Copilot 6/1 才全面改成 量計費的 AI Credits(用 token 消耗換算,Pro $10/月含 $10 額度、Pro+ $39/月含 $39 額度,超用另計),而且把 Opus 級模型的倍率往上調——早期就重度使用的團隊帳單直接跳升。同時 Copilot 從 6/9 起讓 Pro+ / Business / Enterprise 用戶用上 Fable 5,主打「更少工具呼叫、更省 token 完成同樣的活」。
Cursor 這邊,月費 20 美元對上 Copilot 的 10 美元,六月改計費後價差更明顯;而 OpenAI 的 GPT-5.3-Codex 已經原生進駐 Cursor 和 VS Code,用 API 分批開放。
怎麼看:三家的算盤其實同一個——agent 會連續呼叫工具、吃掉大量 token,所以「每 token 多少錢」和「同一件事要用掉幾個 token」正在變成選工具的決定性因素,而不只是模型分數。Sonnet 5 用「便宜 + 少 token 完成」兩手一起打,正是打在這個痛點上。對 iOS/SDK 工程師的實務建議:這波先別急著綁死單一工具,促銷期(Sonnet 5 到 8/31、各家計費還在變)正好拿真實專案跑跑看每月帳單,再決定主力。
Anthropic 企業部署一次上齊:Bedrock/Google Cloud gateway、Microsoft Foundry GA
除了模型,Anthropic 昨天還把「怎麼在公司裡安全地部署 Claude」這一塊補得很滿。
最實際的是新推出的 Claude apps gateway,支援 Amazon Bedrock 和 Google Cloud——它是一個自建的控制層(self-hosted control plane),讓公司自己管 Claude Code:接企業 SSO(單一登入)、統一套用政策、做角色權限控管(RBAC)、算每個人的用量成本、還能設花費上限。對 IT 和資安部門來說,這才是敢不敢在公司大規模開放 AI coding 的關鍵。
同一批更新還有:Trusted Devices(Team / Enterprise 方案,遠端啟動 Claude Code session 前先驗證裝置)、企業託管驗證(beta);Claude Code 本身加了組織預設模型、可讀的 session 名稱、可點的檔案附件、更順的 agents 檢視。另外,Claude in Microsoft Foundry 正式 GA(一般可用)。
怎麼看:這些不性感,但方向很清楚——Anthropic 想拿下的是「企業把 agent 部署進正式工作流」這一仗。模型再強,公司不敢放,也是零。gateway 這種東西,等於把「成本失控」和「權限外洩」兩個 CIO 最怕的問題先堵起來。呼應這幾天 tokenmaxxing 退燒、企業開始管 AI 開銷的趨勢:誰能讓老闆「看得到、管得住」花費,誰就更容易被買單。
值得關注
- Claude Science 那個「可靠度」數字很嚇人:Anthropic 展示的研究指出,前沿模型在回答「同一段病毒序列查詢」時,準確率一度低到 16.9%;但只要加上一個確定性檢索工具(deterministic retrieval,簡單說就是讓模型去查權威資料庫、而不是自己憑記憶答),所有受測模型的準確率全部衝過 92%。這也是為什麼 Claude Science 硬要塞 60 多個資料庫進去——科學應用裡,「會查」比「會猜」重要太多。
- Gemini 3.5 Pro 七月發布倒數:Google 旗艦(2M token 上下文、Deep Think 推理)確認延到七月,目前仍只在 Vertex AI 限量預覽。今天 Anthropic 用 Sonnet 5 搶先落地,Google 七月這一發的壓力又更大了。
- SK Hynix 那斯達克掛牌 7/10:全球 HBM 一哥的 294 億美元 ADR 上市,目標下週五。這是七月上半場最大的資本市場事件,牽動整條 AI 記憶體供應鏈。
- 一個要澄清的誤傳:網路上有說法稱「Colorado AI Act 6/30 正式生效、成為全美第一部生效的州級 AI 法」——這是錯的。Colorado 州長 Polis 5/14 已簽署 SB 189,把生效日延到 2027/1/1,並大幅縮減原本的義務(拿掉演算法歧視的注意義務、風險評估等)。做 AI 產品的團隊排合規時程時,別被舊訊息帶偏。