每日精選 AI/Tech 新聞,繁體中文整理
📍 今日全焦點
- OpenAI AI 獨力破解 80 年數學難題 — 無需引導、自行連結代數數論,數學界說這是 AI 第一次真的解開一個領域核心問題
- Mini Shai-Hulud 全週回顧:GitHub 3,800 repos 外洩 — Nx Console 被投毒 18 分鐘就讓 GitHub 中鏢,OpenAI macOS App 6/12 要強制更新
- Gemini + Adobe/Canva/CapCut 全整合 — 在 Gemini 生圖、用 Adobe 修、拿 CapCut 剪片,一個視窗搞定
- Anthropic 收購 Stainless — Claude SDK 要大幅升級,Python/TypeScript/Go 都受益
- Intuit 裁 3,000 人,CEO 說「與 AI 無關」 — 同一天宣布把資源全押 AI,外界不信
今日頭條
「這個問題,數學家卡了 80 年。」OpenAI 的模型收到題目,自己想通了
5/20,OpenAI 公布了一個在數學社群炸開的消息:他們內部的一個通用推理模型,獨立推翻了一個由匈牙利數學家 Paul Erdős(厄多斯,20 世紀最多產的數學家之一)在 1946 年提出的幾何猜想。
這個問題叫「平面單位距離問題」:在一個平面上,N 個點最多能有多少對點對彼此距離剛好等於 1?Erdős 猜測上限大約是 N 的 1.5 次方。數學家研究了快 80 年,都覺得大概對,但沒有人找到比「正方格」排法更好的構型。
AI 找到了。
更讓人意外的是方法:它沒有從幾何入手,而是走了一條沒人想到的路——把問題接到了代數數論(algebraic number theory),利用一個 1964 年就有的數學工具(Golod-Shafarevich 準則),建構出一個能產生遠比正方格更多單位距離對的無限家族構型。
劍橋大學數學家 Timothy Gowers(Fields Medal 得主,菲爾茲獎相當於數學界的諾貝爾) 看完後說:「這是 AI 數學的一個里程碑。」普林斯頓數學家 Will Sawin 接著完善了結果,把改進量化:最佳構型現在可以達到 n 的 1.014 次方,正式超越了 Erdős 的上限猜測。
這跟以前 AI 解數學題有什麼不同:以前 AI 的數學成績大多是「會刷競賽題」,屬於有固定解法的賽場。這次不同——模型沒有被針對這個問題訓練過,沒有查到現有解答,也沒有被人類一步步引導。它收到問題敘述,自己找到了一條從來沒人走過的路。
Jack Clark(Anthropic 聯創人)上週在牛津說「AI 12 個月內將協助科學家拿諾貝爾」——這個消息落地的時機讓人在意,OpenAI 算不算搶先給了一個預言快要成真的信號?
新聞摘要
後續:Mini Shai-Hulud 本週全貌——GitHub 3,800 個 repo 外洩,OpenAI macOS App 6/12 強制更新
這一週的 Mini Shai-Hulud 不只是「又有套件被投毒」——它打到 GitHub 自己了。
上週的每日報導追蹤了 VS Code 擴充套件淪陷和 SLSA 繞過。這裡補全本週的完整圖:
5/18,Nx Console VS Code extension 被投毒 18 分鐘。 Nx Console 有 220 萬個安裝、官方認證出版商身份,TeamPCP 用前一波攻擊從 TanStack 竊來的 credentials 偷換了一個版本。這個惡意版本在 Visual Studio Marketplace 上活了 18 分鐘——足夠了。它的 payload 靜默執行後,鎖定 1Password 保險庫、GitHub token、npm token、AWS 金鑰、以及 Claude Code 的 ~/.claude/settings.json 設定。
5/19-20,GitHub 確認 3,800 個內部 repo 被竊。 攻擊者用偷來的 GitHub credentials 橫向移動,把 GitHub 自己的內部倉庫清走了一批。GitHub CISO 確認「目前沒有客戶資料被波及的證據」,但也承認部分內部 repo 含有客戶支援互動的片段,後續仍在確認中。
同批攻擊確認受害者還包括:OpenAI(2 台員工裝置被入侵,部分原始碼外洩)、Mistral AI(1 台裝置被入侵,被勒索 Monero $25,000)、歐洲委員會官方網站。
開發者需要注意的事:OpenAI 宣布 6/12 起撤銷 macOS ChatGPT App 的程式碼簽名憑證(code-signing certificate)——更新版憑證的 App 會在 6/12 後因 macOS Gatekeeper(蘋果的 App 安全驗證機制)失效被擋下,需要重新安裝。OpenAI 目前尚未向一般用戶公告這件事。
如果你有裝 Nx Console,要做的事:旋轉(rotate)所有 GitHub PAT、npm token、AWS/GCP/Azure 金鑰,確認 ~/.claude/settings.json 沒有被竄改。
Gemini 全整合 Adobe、Canva、CapCut——在一個視窗裡完成創意全流程
Google I/O 之後,Gemini 這一週落地了三個創意平台整合。
這三個整合加在一起,讓 Gemini 從「AI 生成內容的出口」變成「創意工作流的中控台」:
Adobe:Firefly AI Assistant agent 可以從 Gemini 直接呼叫,執行跨 Photoshop、Premiere、Illustrator、Lightroom 的複雜工作流。不需要在四個 Adobe 應用程式之間切換,用對話告訴 Gemini 要做什麼,它幫你協調 Adobe 的工具執行。
Canva:「Magic Layers」功能現在對 Gemini AI Ultra 訂閱者開放 beta。在 Gemini 生成一張圖,打開 Canva 後每個元素自動分成獨立的圖層(文字、背景、主體分開),可以單獨調整。
CapCut(宣布於 5/21,近期推出):超過 12 億次下載的影片剪輯 App,將來可以在 Gemini 裡直接修片——剪輯、加特效、自動生成字幕,用對話完成。
小露觀察:這是 Google 做過最聰明的平台策略之一。不是要取代 Adobe 或 Canva,而是把它們變成 Gemini 的插件——創作者原本的工具都留著,只是現在可以用 AI 對話串起來。對獨立創作者和小型行銷團隊的效率衝擊是真實的。
同時確認:Gemini Spark(24/7 個人 AI Agent)將在幾週內開放 MCP 支援,Canva、Instacart、OpenTable 等第三方服務將能被 Gemini 在背景自主操作。Gemini AI Ultra 訂閱者優先取得 Beta 資格。
Anthropic 收購 Stainless——Claude SDK 的開發者體驗要全面升級
一個很多開發者用過但可能不知道名字的公司,被 Anthropic 買了。
Stainless 是一家做 API SDK 的新創——你可能沒聽過它,但如果你用過 OpenAI 的 Python SDK,你用的就是它做的。Cloudflare、Merge 等公司也是它的客戶。Stainless 的方法是從 OpenAPI 規範自動生成各語言的 SDK,強型別、語言原生風格、一致的 pattern,品質和易用性明顯優於大多數 API 公司自己手寫的 SDK。
Anthropic 5/18 宣布收購。 意義直接:Claude 的 Python、TypeScript、Java、Go、Ruby 等語言 SDK 在未來 6-12 個月會顯著提升。如果你有感覺 Anthropic SDK 和 OpenAI SDK(Stainless 同一家做的)之間的體驗落差,這個落差正在被刻意消弭。
對比一下:Anthropic 現在同時付 xAI 每月 $12.5 億算力費、剛宣布單季獲利、估值衝 $9,000 億、同時收購一家 SDK 新創——這個階段把資源放在「讓開發者更好用 Claude API」,說明 Anthropic 在衝規模的同時,知道開發者生態的厚度是長期護城河。
Intuit 裁員 3,000 人,CEO 說「與 AI 無關」——同一天的投資人簡報說的是另一件事
TurboTax 和 QuickBooks 的母公司 Intuit,這週同時宣布了兩件事:裁掉 17% 員工,和把省下的錢全押 AI。
5/20,Intuit 執行長 Sasan Goodarzi 宣布裁員 3,000 人(佔全員約 17%),同時發布 Q3 財報。他在媒體受訪時特別強調:「這次裁員與 AI 無關,是簡化組織架構的決策。」
外界沒買單。 原因很簡單:同一份公告說,省下的錢將用於 AI 驅動的 QuickBooks 工作流和 TurboTax 自動化投資。Intuit 今年在 AI 基礎設施上的資本支出明顯上升。「裁員不是因為 AI,但省下來的預算全去買 AI」——這個邏輯鏈讓「與 AI 無關」的說法很難成立。
預估每年可節省 5 億美元以上的成本。Intuit 股票在裁員公告後的盤前交易上漲。
這是本週第三起大規模 AI 相關裁員(同週還有 Meta 8,000 人)。AI 驅動的勞動市場重組從「抽象預測」到「具體公告」的速度,正在加快。
值得關注
- OpenAI macOS App 用戶注意:6/12 起 macOS ChatGPT App 現有版本因憑證撤銷將被 Gatekeeper 擋下,需要重新安裝新版。OpenAI 目前尚未公告,留意更新通知
- Anthropic vs Pentagon 裁決懸空:DC 巡迴上訴法院三法官意見分歧(5/19 辯論),裁決時程未定——Anthropic $9,000 億融資輪的法律乾淨度還在等這個信號
- Mini Shai-Hulud 仍在活動:GitHub 已外洩,OpenAI/Mistral 均受波及,VS Code 擴充套件仍是主要攻擊向量。沒做過憑證輪換的開發者,現在是時候
- Gemini Spark MCP Beta:幾週內對美國 Google AI Ultra 訂戶開放,Canva/Instacart/OpenTable 已在排隊接入——個人 AI Agent 的實際落地在今年 Q2 就要來了