TL;DR: 你打給 AI 的那句「謝謝」大概只值 2 個 token,幾乎不花錢。真正花錢的不是那兩個字,是它為了回你一句「不客氣」而被迫多跑的一整輪運算,那才是 Sam Altman 口中「幾千萬美元」的來源。至於禮貌會不會讓回答變好?兩篇正經研究的結論直接打架,目前沒定論。


Sam Altman 講過一句話,那陣子瘋傳:有人問他,大家對 ChatGPT 講「請」和「謝謝」,到底讓 OpenAI 多花了多少電費。他大概的意思是,幾千萬美元,但花得很值得。

我第一個念頭很直接:那我是不是該閉嘴?

我平常打字會不自覺加「麻煩你」「謝謝」,明明知道對面是台機器,它又不會難過。但幾千萬美元這個數字一出來,我忽然有點心虛,好像我每天那點客套,正在某個資料中心裡默默燒錢。於是我做了件很無聊的事:把這句謝謝丟進去,實際量一次,看它到底花掉什麼。

你的「謝謝」只值兩個 token

token 是 AI 計算和計費的最小單位。你可以粗略想成:一個中文字大概一個 token,一個常見的英文短字也是。我用 ChatGPT 現在實際在算的那套方式量了幾個客套話(工程上叫 tokenizer,名字是 o200k_base,這串你可以直接略過):

你打的字 token 數
1
謝謝 2
謝謝你 3
please 1
thank you 2

兩個 token。如果你把一句普通指令前後都包上禮貌,「不好意思麻煩你,可以幫我把這段翻成英文嗎?謝謝你」,比起光禿禿的「把這段翻成英文」,也只多了大概 15 個 token。英文也差不多。

想知道 token 到底是什麼、為什麼 AI 是用它而不是用「字」在算,我在Token 是什麼?拆得比較細。這裡的重點只有一個:以單價算,禮貌幾乎是免費的。一句謝謝的成本,小數點後要拖很多個零才看得到。

那「幾千萬美元」是從哪冒出來的?

真正貴的是它回你的那句「不客氣」

關鍵在一個我一開始也沒想到的地方:你單獨丟一句「謝謝」過去,不是只送出了 2 個 token,而是讓整台模型為了這 2 個 token,從頭跑了一次。

它得把你們整段對話重讀一遍(模型每一輪都是重看一次,並不會真的「記得」上一句,這件事我在為什麼 AI 會忘記我前面說過的話?寫過),跑一次運算,再生出一句「不客氣!還有什麼需要幫忙的嗎?」回你。那句回覆叫 output token(你打的字是 input、它回的是 output),而 output 一般比 input 貴上好幾倍。真正燒的還不只是 token,是背後那張 GPU 為了這一輪所做的計算。

Altman 自己在別的場合給過一個數字:ChatGPT 平均一次查詢大約耗 0.34 瓦時的電,差不多是烤箱開一秒多。單看一次,少到可以忽略。但你那句純客套,等於硬是多生了一次完整查詢,一次沒帶任何資訊、純粹禮尚往來的查詢。把這個乘上 ChatGPT 每天幾億則訊息裡那一小撮「謝謝」「太棒了」「辛苦了」,加起來就是幾千萬美元。

所以那筆錢從頭到尾都不是花在你打的字上。你那聲謝謝幾乎不要錢,貴的是它叫醒一整台機器,只為了回你一句「不客氣」。

我在Token 成本的真相寫過一個很像的形狀:真正失控的成本,常常不在你看得到的那個動作,而在它連帶觸發的下游。禮貌剛好又是一個例子。

那禮貌至少會讓回答變好吧?

這才是我本來最想知道的:就算花點錢,如果客氣能換到更好的答案,那也算划算。

我去翻了一下,結果研究自己先吵起來了。

2024 年有篇跨語言研究(英文、中文、日文都測),結論是:太兇的指令確實會讓回答變差,但太客氣也不會更好,而且最佳的禮貌程度居然跟語言有關。聽起來很合理,禮貌有用、但別過頭。

結果 2025 年另一篇短論文反過來打臉。他們把同一批題目改寫成從「非常客氣」到「非常無禮」五種語氣去問,發現無禮的版本準確率反而高一點點(非常客氣 80.8%、非常無禮 84.8%)。差距不大,但方向整個相反,作者猜是比較新的模型對語氣的反應跟舊的不一樣了。

兩篇都是正經做的,結論卻打架。所以「禮貌讓 AI 變聰明」這件事,我現在的看法是:影響很小,而且不穩定,目前沒有人能拍胸脯下定論。誰要是跟你保證「對 AI 客氣回答就會更好」,大概是話講太滿了。

那到底要不要說

量完、查完,我還是會繼續打「謝謝」。

理由變了。不是因為它會讓 ChatGPT 更賣力,這點證據根本不站在我這邊。比較像是,我不太想養成「對著一個會講人話的東西頤指氣使」的習慣,怕哪天那個語氣會滲到我跟真人的對話裡。

如果你是在跑大量自動化、每天幾十萬次呼叫的場景,那又是另一回事。那種規模下,把每則 prompt 的客套字砍掉是合理的,省的不只是那幾個 token,是被觸發的那些多餘往返。這跟你在聊天框裡隨手打的謝謝,是兩種完全不同的數量級。我在每天開著三個 AI 視窗那篇也提過,日常隨手用跟認真當工具用,本來就該用不同的標準。

所以這題沒有漂亮的標準答案。你那句謝謝很便宜,它換來的答案品質是個謎,而要不要說,從頭到尾是你想當一個怎樣的人,跟那台機器沒什麼關係。