TL;DR:我自己的理解大概是這樣:AI 在做的事,從頭到尾就是「看著前面的字,猜下一個最順的字」。它優化的是「順不順、像不像話」,不是「對不對」。所以講對跟講錯用的是同一套力氣、同一種口氣,因為對它來說那根本是同一件事。它沒有內建一顆「我其實不知道」的按鈕,預設就是把話接得漂漂亮亮。篤定,跟它到底知不知道,是兩回事。(這是簡化過的講法,而且模型一直在進步,看看就好。)
你大概也被唬過吧。問 AI 一個東西,它回得有條有理、語氣篤定,你看了覺得很合理,結果拿去一查,整段是它編的。氣的不是它錯,是它錯得那麼自然,完全沒有一點心虛。
我一直覺得這件事滿有意思的。它到底為什麼可以這樣?後來大概想通一點,分享一下我自己的理解,不一定對。
它根本沒在分「對」跟「錯」
先講最核心的一件事:它其實沒有在判斷真假。
你可以把它想成一個超級加強版的手機輸入法。你打「我今天很」,輸入法會跳「開心」「累」「忙」給你選,對吧。它怎麼知道要跳這幾個?因為在它看過的一大堆句子裡,「我今天很」後面接這些字最順。它不是懂你今天過得好不好,它只是知道哪個字接上去最像人話。
AI 講白了就是這個東西放到很大很大。它從頭到尾在做的,就是看著前面那串字,猜「下一個最順的字是什麼」,吐出來,再看著變長的這串繼續猜下一個,一個字一個字接成一整段。(如果你好奇它眼裡的「字」其實長什麼樣,那是一種叫 token 的東西,我在 Token 是什麼?LLM 為何只讀 Token? 裡有聊,這段不看也完全不影響理解。)
重點是:它整個過程在追求的,是「順」,是「像不像話」。不是「對不對」。這兩個常常剛好一致——順的話通常也是對的——但它們不是同一件事。一旦分岔,它會毫不猶豫地選「順」,把一句很順但是錯的話講給你聽。它不是故意騙你,它就是少了一個「先查證、再決定要不要這樣講」的步驟,講之前沒人幫它把關。
那「很有自信」的口氣是哪來的
這就是它唬人的關鍵了。
它學講話的材料,是人類寫的一大堆文字。而人類寫東西的時候,口氣通常是滿肯定的——文章、教學、百科、回答,大家都把話講得斬釘截鐵。它把這些讀進去,順便也就學會了那種「篤定的腔」。所以它預設講出來的東西,聽起來就是一副很有把握的樣子,因為它模仿的就是這種樣子。(而且後面那層用人類評分做的微調也往同個方向推:直接、肯定、感覺有用的回答,通常分數比較高。)
問題是,它沒有另外長一顆「欸我這題其實不太確定」的按鈕。一個真人不知道的時候,會吞吐、會說「我猜啦」、會皺眉。它不會。它不知道的時候,還是用一模一樣的順、一模一樣的篤定,把一段話接給你。對它來說「我知道」跟「我不知道」這兩種狀態,輸出起來長得幾乎一樣。
同樣的篤定口氣,一個是真的、一個是它編的——光看語氣你分不出來。
所以「它講得很有信心」這件事,真的不能拿來當「它是對的」的證據。一點都不能。這大概是我覺得最該記住的一句。
它什麼時候最會一本正經地胡說
照這個邏輯推一下就猜得到:它最會掰的,是那種它其實沒什麼料的題目。
很冷門的、很新的、很細節的東西——某個沒什麼人寫過的小工具的參數、上禮拜才發生的事、某本書第幾頁講了什麼——它手上的料很薄。可是它又不能不接話,「猜下一個字」這個機制一啟動,它還是會生出一段讀起來很完整的東西給你。料越薄,它越是用想像力把空格填滿,而且填得一樣順。
所以有個滿好用的直覺:當你問的東西越冷門、越具體、越要求「精確」,你心裡的警報就該開得越大。它在這種地方翻車的姿勢,往往最優雅。
我自己是怎麼跟它相處的
知道這件事之後,其實也不用怕它,調整一下心態就好。
我的做法很簡單,就是把「順」跟「對」這兩件事在腦子裡分開。它講得順、講得好聽,我照收,當草稿、當靈感很好用。但只要是有名有姓、有數字、有日期、我打算拿去用的東西,我就不會它說了我就信,會自己再查一下。這條習慣我在前一篇 我每天開著三個 AI 的幾個小習慣 裡也有提到,這篇算是把背後的原因補上,講為什麼那條習慣值得養,大概就是因為這篇講的這件事。
說穿了就是:把它當一個口才很好、見多識廣、但偶爾會一本正經唬你的朋友。你會聽他講,但重要的事你會自己再確認一下,對吧。差不多就是這種距離。
最後,這只是我現在的理解
要老實說一下,上面整套講法是簡化過的,真要摳細節,裡面還有一堆東西我也沒講(也不一定全懂)。而且這東西一直在變。已經有人在想辦法讓模型學會講「我不太確定」、會附上它有多少把握、會去查證再回答。搞不好過個一兩年,「AI 很愛自信地唬爛」這個說法本身就過時了,那這篇也就可以收起來了。
不過至少以現在來說,下次它又用那種無比篤定的口氣回你一段話的時候,你心裡可以默默補一句:講得順,不代表它知道喔。