Fable 5 跟 Claude Mythos 5 差在哪？

同一個底層模型，差在護欄。Fable 5 是公開版、護欄全開；Mythos 5 把部分護欄解除，只提供給授權的資安防禦團隊跟生醫研究單位。

Claude Fable 5 價格多少？

API 定價每百萬 input token $10、output $50，官方說比 4 月的 Mythos Preview 便宜一半以上。另外 6/9 到 6/22 之間，Pro、Max、Team 訂閱方案直接包含 Fable 5 不另收費；6/23 起會從訂閱方案移除，改走 usage credits。

跟 Opus 4.8 比，實際用起來差在哪？

官方的說法是「任務愈長愈複雜，Fable 5 領先愈多」。我第一天的體感吻合：丟給它一個專案級的任務，它會照 repo 既有的治理流程把工作展開成有編號的階段、自己開自己填 work log、一個一個收掉。同一套流程之前的模型也跑得動，我真正敢講的差別是這次幾乎不用人押著走。代價是 token 用量明顯比之前兇：Effort 滑桿只開到 High（還沒拉滿），Max 20x 的五小時用量窗口也是一下就燒完。

Claude Fable 5 是什麼？第一個公開的 Mythos 級模型，加上我第一天的使用心得

Q: Claude Fable 5 是什麼？

Anthropic 在 2026/6/9 釋出的模型，是第一個對一般用戶開放的 Mythos 級模型。Mythos 級是 Opus 之上的新能力層級。Fable 5 加了安全護欄：在資安、生物這類高風險題目觸發偵測時，回答會自動改由 Claude Opus 4.8 接手，官方說超過 95% 的 session 完全不會碰到這個機制。

TL;DR：Anthropic 6/9 釋出 Claude Fable 5，第一個對公眾開放的 Mythos 級模型（Opus 之上的新層級），API 定價 $10/$50 per M tokens，6/22 前 Pro/Max 訂閱直接含。我第一天把三個專案丟給它掛著跑，最大的體感是它把 repo 既有的治理流程當自己的事在跑。這套結構是制度本來就會逼出來的，之前的模型也照做過；這次的差別是我幾乎不用出手。另一個體感是 token 燒得很兇，而且這兩件事是同一件事。

Anthropic 在 6/9（美國時間）釋出 Claude Fable 5。我隔天把手上三個專案的 agent session 全切過去，掛著跑了一個晚上，早上起來收成績：三個 repo 加起來四十個上下的 PR，走完該走的關卡 merge 掉。那個晚上我做的最有生產力的事是去睡覺。

這篇想講兩件事：Fable 5 到底是什麼（「Mythos 級」這個詞值得解釋一下），還有第一天用下來，跟之前用 Opus 最不一樣的兩個體感。

Mythos 級是什麼

Claude 的模型線本來是三層：Haiku、Sonnet、Opus。Mythos 級是疊在 Opus 上面的新一層。第一個 Mythos 模型是今年 4 月透過 Project Glasswing 給少數夥伴用的 Mythos Preview，這次則一口氣來兩個：Claude Fable 5 跟 Claude Mythos 5。

照官方公告的講法，這兩個是同一個底層模型，差別在護欄。Fable 5 是公開版：當它的 classifier 在資安、生物化學、模型蒸餾這類高風險題目上被觸發，回答會自動改由 Claude Opus 4.8 接手——官方的說法是「比直接拒答好得多的體驗」，而且超過 95% 的 session 根本不會碰到這個機制。Mythos 5 則把部分護欄解除，只給授權的資安防禦團隊跟生醫研究單位。

講白一點，Fable 5 就是「做了安全處理、可以給大家用的 Mythos」。一個模型，兩種講法，我自己猜名字也是在玩這個：Mythos 是神話原典，Fable 是講給大家聽的寓言版。沒查到官方解釋，姑且當作取名的人有想過。

TechCrunch 那篇的標題有點酸，說 Anthropic 前幾天才警告 AI 太危險、轉頭就把最強的模型放出來。護欄加 fallback 這個設計大概就是他們對這個矛盾的回答——能不能服眾是另一回事，但至少是個有結構的回答。

價格，跟一個 6/22 截止的窗口

API 定價：每百萬 input token $10、output $50。官方說比 Mythos Preview 便宜一半以上（Preview 的價格本來就沒公開，這句只能聽他們的），但在 Claude 家族裡仍然是最貴的一級，尤其 output 是 input 的五倍，這個比例對 agent 工作流不是好消息。

訂閱方面有個要記的時間點：6/9 到 6/22，Pro、Max、Team 跟按席次計費的 Enterprise 方案直接包含 Fable 5，不加錢。6/23 起從訂閱方案移除，改走 usage credits。也就是說現在是一個兩週的免費試用窗口，這篇某種程度上就是在提醒你這件事。

體感一：它把 repo 的治理流程當真

第一天我給其中一個 side project（一個掛在 agentic-os 治理底下的虛擬辦公室專案）的指令，大概是「對專案流程有幫助的、讓專案變得很穩定」這種粒度。所謂治理，講白話就是 repo 裡一套白紙黑字的工作規矩：開工前要開工作日誌、要寫規格、要過幾道檢查才准說做完。它把這句話展開成 backlog 上十幾個有編號的項目，排成 hardening 跟 stability 兩個 wave，照優先序一個一個收掉。每個項目有自己的 work log 跟規格，做完歸檔，wave 結束還有 closeout。我半夜瞄了一眼進度，看起來就像在看一個照表操課的 PM。

不過寫到這裡得先踩個煞車，不然這段會變成業配。把一句話的 brief 展開成有編號的 wave，這件事不是 Fable 5 才會——backlog 前七十幾個項目就是之前的模型照同一套制度清掉的，連「召一排不同視角的 panel 審一個需求、把站不住的理由打掉大半」這種事，舊的 work log 裡也翻得到。制度本來就是設計來逼模型這樣工作的。再翻 commit 紀錄，之前也有單日二十幾個 commit 的日子，這次是三十個。有差，但說換了個世界就太誇張。嚴格講我連對照組都沒有：沒讓 Opus 平行跑一份同樣的 brief，所以這篇請當第一天印象看，不是 benchmark。

那差在哪？模型的功勞跟制度的功勞本來就疊在一起，我挑確定的講。以前是我押著它走：它會想跳過 work log、想直接動手改檔案、想在沒證據的時候說做完了，閘門就是這樣被逼出來的（怎麼讓 AI agent 照流程走寫過一輪）。這次比較像它自己想走在流程上：半夜瞄的那一眼沒有在等我裁決的東西，早上收工的時候也沒有。以前這種掛機的晚上，通常會留一堆要我拍板的問題當早餐。「幾乎不用出手」是我目前唯一敢拿出來講的差別。

有個小例子我滿喜歡的。一個視覺需求（讓角色走路時不要穿過彼此），它從三個視角審完，結論是弊大於利、不做，然後把理由跟「什麼條件下重開」寫成一份 ADR 歸檔。需求方是我，被自己的模型打了回票。這在制度上本來就允許，但被打回票的當下其實滿服氣的——它列的理由我反駁不了。

另一個專案有個檔案 hash 算不對的 bug。它修完我指的那個點之後沒停，連修三輪把同一族的 corruption 全清掉，最後的 commit 訊息自己寫說要把這一類問題終結掉。看著它自己往下追的時候，我沒有想接手的衝動。

官方公告裡有一句「任務愈長愈複雜，Fable 5 的領先愈大」，還附了 Stripe 拿它做五千萬行 Ruby migration 的案例。大公司的案例我通常看看就好，第一天的體感至少方向一致。要再補一句平衡：同一天我在另一個 repo 還是把 Work Log 的鎖從勸告升級成強制。模型變乖了，不代表制度可以拆。

對了，換模型那天我讓第三個專案做的第一件事，是把整套 behavioral eval 對新模型重新 baseline——模型換了，舊測試的假設會破，這個習慣是從沒有證據就不算完成那套來的。結果是整套跑下來差一條全過，那一條追下去是測試自己的假設要修，不是模型的鍋。新模型再聰明，這步我還是不想省。

體感二：token 燒得很兇

規劃性的另一面就是用量。它把任務拉長、自己開 subagent、自己 review 自己改的東西，每一層都是 token。

講個具體的。我是 Max 20x 的訂戶。介面上有個 Effort 滑桿，從 Faster 拉到 Smarter，旁邊老實寫著：effort 越高回應越完整，額度也燒越快。我跑 Fable 5 的時候只開到 High，連最右邊都沒拉滿，五個小時一輪的用量窗口還是一下就見底。免費期內錢包沒有實感，可是 20x 的額度撞牆這件事本身，以前不太發生在我身上。

之前在 Token Economics of AI Agent Governance 算過 governance overhead 的帳，當時的結論是值得。Fable 5 把單價跟用量同時拉高，6/23 免費期結束之後，這筆帳得重算一次——哪些任務值得用 Mythos 級的價錢跑、哪些丟回 Opus 或 Sonnet 就好，大概會變成下半年用 Claude 的人共同的功課。

上次寫 dynamic workflows 的時候提過，同一件事在 conversation 裡做跟丟進 workflow 做，後者明顯貴。Fable 5 等於把那個傾向變成預設個性：它天生就想把事情做大做完整，好處跟帳單都是從這裡來的。

建議

6/22 之前 Pro/Max 反正含著，挑一個你平常會自己切成三天份的任務——不是「幫我修這個 function」，是「把這個專案的測試體質整個弄好」那種粒度——整包丟給它，看它怎麼展開。比看 benchmark 數字有感得多。

還有兩個我接下來想試的：沒有治理框架的裸 Claude Code 用起來長怎樣、Effort 降到中間檔還划不划算。你要是先試了，滿想知道結果的。

Mythos 級是什麼#

價格，跟一個 6/22 截止的窗口#

體感一：它把 repo 的治理流程當真#

體感二：token 燒得很兇#

建議#

延伸閱讀#

同個主題，還有這幾篇

GPT-5.6 的 Sol、Terra、Luna 是什麼

OpenRouter 上，美國公司使用中國 AI 模型的 token 佔比升到每週 30% 以上

AI 說「完成了」，怎麼確認它真的做完？

Python 的可變預設參數為什麼會累積

Mythos 級是什麼

價格，跟一個 6/22 截止的窗口

體感一：它把 repo 的治理流程當真

體感二：token 燒得很兇

建議

延伸閱讀