TL;DR:Anthropic 6/9 釋出 Claude Fable 5,第一個對公眾開放的 Mythos 級模型(Opus 之上的新層級),API 定價 $10/$50 per M tokens,6/22 前 Pro/Max 訂閱直接含。我第一天把三個專案丟給它掛著跑,最大的體感是它把 repo 既有的治理流程當自己的事在跑。這套結構是制度本來就會逼出來的,之前的模型也照做過;這次的差別是我幾乎不用出手。另一個體感是 token 燒得很兇,而且這兩件事是同一件事。
Anthropic 在 6/9(美國時間)釋出 Claude Fable 5。我隔天把手上三個專案的 agent session 全切過去,掛著跑了一個晚上,早上起來收成績:三個 repo 加起來四十個上下的 PR,走完該走的關卡 merge 掉。那個晚上我做的最有生產力的事是去睡覺。
這篇想講兩件事:Fable 5 到底是什麼(「Mythos 級」這個詞值得解釋一下),還有第一天用下來,跟之前用 Opus 最不一樣的兩個體感。
Mythos 級是什麼
Claude 的模型線本來是三層:Haiku、Sonnet、Opus。Mythos 級是疊在 Opus 上面的新一層。第一個 Mythos 模型是今年 4 月透過 Project Glasswing 給少數夥伴用的 Mythos Preview,這次則一口氣來兩個:Claude Fable 5 跟 Claude Mythos 5。
照 官方公告 的講法,這兩個是同一個底層模型,差別在護欄。Fable 5 是公開版:當它的 classifier 在資安、生物化學、模型蒸餾這類高風險題目上被觸發,回答會自動改由 Claude Opus 4.8 接手——官方的說法是「比直接拒答好得多的體驗」,而且超過 95% 的 session 根本不會碰到這個機制。Mythos 5 則把部分護欄解除,只給授權的資安防禦團隊跟生醫研究單位。
講白一點,Fable 5 就是「做了安全處理、可以給大家用的 Mythos」。一個模型,兩種講法,我自己猜名字也是在玩這個:Mythos 是神話原典,Fable 是講給大家聽的寓言版。沒查到官方解釋,姑且當作取名的人有想過。
TechCrunch 那篇 的標題有點酸,說 Anthropic 前幾天才警告 AI 太危險、轉頭就把最強的模型放出來。護欄加 fallback 這個設計大概就是他們對這個矛盾的回答——能不能服眾是另一回事,但至少是個有結構的回答。
價格,跟一個 6/22 截止的窗口
API 定價:每百萬 input token $10、output $50。官方說比 Mythos Preview 便宜一半以上(Preview 的價格本來就沒公開,這句只能聽他們的),但在 Claude 家族裡仍然是最貴的一級,尤其 output 是 input 的五倍,這個比例對 agent 工作流不是好消息。agent 的 output 從來不少。
訂閱方面有個要記的時間點:6/9 到 6/22,Pro、Max、Team 跟按席次計費的 Enterprise 方案直接包含 Fable 5,不加錢。6/23 起從訂閱方案移除,改走 usage credits。也就是說現在是一個兩週的免費試用窗口,這篇某種程度上就是在提醒你這件事。
體感一:它把 repo 的治理流程當真
第一天我給其中一個 side project(一個掛在 agentic-os 治理底下的虛擬辦公室專案)的指令,大概是「對專案流程有幫助的、讓專案變得很穩定」這種粒度。所謂治理,講白話就是 repo 裡一套白紙黑字的工作規矩:開工前要開工作日誌、要寫規格、要過幾道檢查才准說做完。它把這句話展開成 backlog 上十幾個有編號的項目,排成 hardening 跟 stability 兩個 wave,照優先序一個一個收掉。每個項目有自己的 work log 跟規格,做完歸檔,wave 結束還有 closeout。我半夜瞄了一眼進度,感覺不像在看模型跑任務,比較像在看一個照表操課的 PM。
不過寫到這裡得先踩個煞車,不然這段會變成業配。把一句話的 brief 展開成有編號的 wave,這件事不是 Fable 5 才會——backlog 前七十幾個項目就是之前的模型照同一套制度清掉的,連「召一排不同視角的 panel 審一個需求、把站不住的理由打掉大半」這種事,舊的 work log 裡也翻得到。制度本來就是設計來逼模型這樣工作的。再翻 commit 紀錄,之前也有單日二十幾個 commit 的日子,這次是三十個。有差,但說換了個世界就太誇張。嚴格講我連對照組都沒有:沒讓 Opus 平行跑一份同樣的 brief,所以這篇請當第一天印象看,不是 benchmark。
那差在哪?模型的功勞跟制度的功勞本來就疊在一起,我挑確定的講。以前是我押著它走:它會想跳過 work log、想直接動手改檔案、想在沒證據的時候說做完了,閘門就是這樣被逼出來的(怎麼讓 AI agent 照流程走寫過一輪)。這次比較像它自己想走在流程上:半夜瞄的那一眼沒有在等我裁決的東西,早上收工的時候也沒有。以前這種掛機的晚上,通常會留一堆要我拍板的問題當早餐。「幾乎不用出手」是我目前唯一敢拿出來講的差別。
有個小例子我滿喜歡的。一個視覺需求(讓角色走路時不要穿過彼此),它從三個視角審完,結論是弊大於利、不做,然後把理由跟「什麼條件下重開」寫成一份 ADR 歸檔。需求方是我,被自己的模型打了回票。這在制度上本來就允許,但被打回票的當下其實滿服氣的——它列的理由我反駁不了。
另一個專案有個檔案 hash 算不對的 bug。它修完我指的那個點之後沒停,連修三輪把同一族的 corruption 全清掉,最後的 commit 訊息自己寫說要把這一類問題終結掉。看著它自己往下追的時候,我沒有想接手的衝動。
官方公告裡有一句「任務愈長愈複雜,Fable 5 的領先愈大」,還附了 Stripe 拿它做五千萬行 Ruby migration 的案例。大公司的案例我通常看看就好,第一天的體感至少方向一致。要再補一句平衡:同一天我在另一個 repo 還是把 Work Log 的鎖從勸告升級成強制。模型變乖了,不代表制度可以拆。
對了,換模型那天我讓第三個專案做的第一件事,是把整套 behavioral eval 對新模型重新 baseline——模型換了,舊測試的假設會破,這個習慣是從沒有證據就不算完成那套來的。結果是整套跑下來差一條全過,那一條追下去是測試自己的假設要修,不是模型的鍋。新模型再聰明,這步我還是不想省。
體感二:token 燒得很兇
規劃性的另一面就是用量。它把任務拉長、自己開 subagent、自己 review 自己改的東西,每一層都是 token。
講個具體的。我是 Max 20x 的訂戶。介面上有個 Effort 滑桿,從 Faster 拉到 Smarter,旁邊老實寫著:effort 越高回應越完整,額度也燒越快。我跑 Fable 5 的時候只開到 High,連最右邊都沒拉滿,五個小時一輪的用量窗口還是一下就見底。免費期內錢包沒有實感,可是 20x 的額度撞牆這件事本身,以前不太發生在我身上。
之前在 Token Economics of AI Agent Governance 算過 governance overhead 的帳,當時的結論是值得。Fable 5 把單價跟用量同時拉高,6/23 免費期結束之後,這筆帳得重算一次——哪些任務值得用 Mythos 級的價錢跑、哪些丟回 Opus 或 Sonnet 就好,大概會變成下半年用 Claude 的人共同的功課。
上次寫 dynamic workflows 的時候提過,同一件事在 conversation 裡做跟丟進 workflow 做,後者明顯貴。Fable 5 等於把那個傾向變成預設個性:它天生就想把事情做大做完整,好處跟帳單都是從這裡來的。
建議
6/22 之前 Pro/Max 反正含著,挑一個你平常會自己切成三天份的任務——不是「幫我修這個 function」,是「把這個專案的測試體質整個弄好」那種粒度——整包丟給它,看它怎麼展開。比看 benchmark 數字有感得多。
還有兩個我接下來想試的:沒有治理框架的裸 Claude Code 用起來長怎樣、Effort 降到中間檔還划不划算。你要是先試了,滿想知道結果的。
延伸閱讀
- 怎麼讓 AI agent 照流程走:閘門只記帳,不攔人:閘門是為了會繞路的模型設計的;Fable 5 第一天幾乎沒讓閘門出手,但閘門還是要在
- Claude Code 多了個 dynamic workflows,我打開那段 JS 看了一下:Fable 5 開 subagent 的底層機制,上個月先寫過
- Token Economics of AI Agent Governance(英文):token 帳怎麼算的長文,6/23 之後更需要
- Work Log:跨 session 的記憶機制:長任務能掛著跑一晚,記憶機制是前提
- Claude Fable 5 First Impressions(English companion):同主題英文版


