01. 從聊天機器人到數位員工:AI 的第三次覺醒
18 世紀的騙局與人類的終極幻想
1770 年的春天,奧地利維也納的美泉宮(Schönbrunn Palace)迎來了一位神秘的客人。發明家沃夫岡·馮·肯佩倫(Wolfgang von Kempelen)向女皇瑪麗亞·特蕾莎展示了一台震驚世界的機器——「土耳其下棋人」 (Mechanical Turk)。
這是一個製作精良的機械人偶,穿著華麗的土耳其長袍,頭上裹著頭巾,手裡拿著一根長煙斗。它坐在一張巨大的木櫃前,眼神空洞地注視著棋盤。當發明家轉動巨大的黃銅鑰匙,機器內部傳來了齒輪嚙合的咔噠聲,隨後,這隻木頭做的手緩緩抬起,走出了一步精妙的開局。
這台機器在隨後的 80 多年裡巡迴歐美,擊敗了班傑明·富蘭克林,甚至羞辱了拿破崙·波拿巴。據說拿破崙曾故意把馬走到了錯誤的位置試探它,機械人偶竟然停頓了一下,禮貌地把棋子挪回原位,並向皇帝點了點頭。那一刻,所有人都相信:機器擁有了靈魂。
直到 1850 年代,一場大火燒毀了機器,秘密才被徹底揭開:巨大的木櫃裡利用鏡面反射原理製造了視覺盲區,裡面藏著一個身材矮小的國際象棋大師。他蜷縮在悶熱的櫃子裡,通過複雜的槓桿系統操縱人偶。
這個故事聽起來是個笑話,但它極其精準地揭示了人類對於 AI 最原始、最底層的渴望:我們從來都不只想要一個會計算的計算機,我們想要一個像人一樣能「行動」、能「交互」、甚至能「糾正」我們的夥伴。
那個藏在櫃子裡的人,就是人類對「智能」的最初定義。兩百多年過去了,現在的 AI 終於不再需要藏著一個真人了。但 AI 走到今天,其實經歷了三次艱難的覺醒。
第一次覺醒:蠻力的勝利 (1997)
如果你的朋友和你吹噓他早在 90 年代就懂 AI,他指的大概率是 IBM 深藍 (Deep Blue)。
1997 年,深藍擊敗了人類國際象棋冠軍卡斯帕羅夫。那是 AI 的第一次高光時刻,全球媒體都在驚呼「人類被取代了」。但從技術哲學的角度看,深藍其實並不「聰明」。
深藍依靠的是暴力窮舉 (Brute Force)。它不懂什麼叫「大局觀」,也不懂什麼叫「誘敵深入」。它只是憑藉每秒計算 2 億步棋的恐怖速度,把未來 10 步甚至 20 步的所有可能性都算了一遍,然後選擇勝率最高的那一步。
如果你問深藍:「你為什麼要走這一步?」 它回答不上來。因為它沒有思維,它只有數據庫。這時候的 AI,像是一個拿著計算機的會計,嚴謹、枯燥、沒有靈魂。它只能做定義極其明確的任務(如下棋),一旦你讓它去「寫一首詩」或者「識別一隻貓」,它立刻就會當機。
第二次覺醒:直覺的湧現 (2016 - 2022)
真正讓 AI 變得「像人」的,是 AlphaGo 和後來的 ChatGPT。
2016 年,AlphaGo 下出了許多人類棋譜中從未有過的「神之一手」。圍棋的變化數量比宇宙中的原子還要多,靠深藍那種「窮舉法」是算不完的。AlphaGo 贏棋靠的是神經網絡帶來的類似於人類的**「直覺」 (Intuition)**。它「感覺」這一步棋不錯,而不是「算」出來的。
而 2022 年底 ChatGPT 的橫空出世,則是這次覺醒的巔峰。突然之間,機器能讀懂你的冷笑話,能幫你寫情書,能通過律師資格考試。
這是人類歷史上第一次創造出能夠通過圖靈測試的物種。
但在這個階段,AI 有一個致命的缺陷:它是一個「缸中之腦」 (Brain in a Vat)。
想像一下,你把愛因斯坦的大腦取出來,養在一個充滿營養液的玻璃缸裡。它依然絕頂聰明,知道相對論,知道宇宙的奧秘。但是:
- 它沒有眼睛,看不到今天的報紙。
- 它沒有手,沒法幫你倒一杯咖啡。
- 它沒有腿,沒法去幫你取快遞。
ChatGPT 就是這個「缸中之腦」。
- 你問它:「去幫我訂一張明天飛上海的機票。」
- 它只能抱歉地回答:「對不起,我只是一個語言模型,無法訪問互聯網,也無法操作你的信用卡……」
這時的 AI,是世界上最好的顧問,但它不是一個合格的員工。
第三次覺醒:長出雙手的智能體 (2024 - 2026)
當你正在閱讀這篇文章的 2026 年,我們正處於 AI 的第三次覺醒浪潮中:智能體 (Agent) 的崛起。
什麼叫智能體?簡單來說,就是 AI 模型 (大腦) + 工具 (雙手) + 規劃能力 (前額葉)。
以前的 ChatGPT 是這樣的:
你:我的程式碼報錯了,幫我看看。 AI:你看一下第 5 行是不是少了個分號?(它只動嘴,不動手)
現在的 Coding Agent (如 Cursor, Windsurf) 是這樣的:
你:我的程式碼報錯了,修好它。 AI (Agent):收到。
- (AI 自主讀取了你的 50 個程式碼文件)
- (AI 執行了終端機指令,複現了報錯)
- (AI 定位到問題在
utils.js,並修改了它)- (AI 執行了測試,全部通過) AI:修好了,我已經提交了程式碼。
看到了嗎?從「給建議」到「直接幹活」,這就是智能體的本質變化。
現在的 AI 不再滿足於陪你聊天。它們被賦予了聯網的權限、讀取文件的權限、操作瀏覽器的權限。它們開始像 18 世紀那個「土耳其下棋人」一樣,坐在電腦前,替你點擊滑鼠,替你發送郵件,替你完成工作流。
為什麼這一章對普通人很重要?
因為**「使用工具」和「管理員工」**是兩種完全不同的能力。
- 以前 (2023):你需要學習 Prompt Engineering(提示詞工程),像唸咒語一樣,試圖讓 AI 吐出你想要的文字。
- 現在 (2026):你需要學習 Flow Engineering(流程工程),像一個產品經理一樣,把你的工作拆解成步驟,然後指派給不同的 AI Agent 去執行。
在接下來的章節中,我們將不再討論那些枯燥的神經網絡原理。我們將深入解剖這些「矽基員工」:
- 它們的大腦(LLM)到底是如何產生幻覺的?
- 它們是如何通過 RAG 技術擁有記憶的?
- 如果我不小心把公司數據庫的權限給了它們,會發生什麼災難?
歡迎來到 AI 的行動時代。別只顧著聊天了,讓它們動起來吧。
