《AI霸主》,科技巨頭的失控列車

本書的核心,在於揭露OpenAI與DeepMind之間那場驚心動魄的爭霸戰。原文書名《Supremacy》(意指霸權、至高無上) 下得極為精準,它暗示了這不僅是一場技術競賽,而是一場「贏者全拿」的殊死戰。在這個賽局裡,兩家頂尖實驗室只有一個目標:搶在對手之前,開發出能像人類一樣廣泛思考與學習的通用人工智慧(Artificial General Intelligence, AGI)。

作者帕米‧奧森(Parmy Olson)是彭博社(Bloomberg)的權威科技專欄作家。她以深入挖掘科技圈權力鬥爭聞名,在本書中,她運用長達七年的追蹤與第一手獨家訪談,犀利地揭露了兩大實驗室,如何在「改變世界的理想」與「資本市場的現實」拉扯中,逐步引發這場失控的AI軍備競賽。


本書的主旨

理想主義如何被資本主義吞噬。

本書揭示了一個殘酷的真相:AI的發展方向,早已不是由好奇心驅使的「科學探索」所決定,而是被「企業競爭」和「個人野心」所綁架。

作者在向世人警告:這場競賽的速度已經快到連參賽者自己都煞不住車了。

我們正坐在一列由科技巨頭駕駛的失控列車上,且未來取決於極少數公司領導人的決策。而我們卻幾乎沒有選擇的餘地,可能被迫駛向一個充滿不確定性與權力失衡的未來。


ChatGPT引爆的始末

被忽視的論文:Google錯失的AI火種。2017年,Google Brain的烏斯克瑞特(Jakob Uszkoreit)等8人團隊發表論文〈Attention Is All You Need〉,正式定義了Transformer架構。然而,Google管理層受限於「創新者的兩難」,竟然未將其推向市場。

★註: 有關Transformer的故事細節,可參見《黃仁勳傳》,『運氣』但有遠見作為基礎 中『(4) 2017:Transformer』段落。

原本OpenAI持續模仿DeepMind在遊戲模擬與強化學習(RL)的路線,但首席科學家—蘇茨克維(Ilya Sutskever)則不斷思考:如何將Transformer技術用於語言處理?團隊進行了關鍵的技術創新:在傳統的編碼器(Encoder)與解碼器(Decoder)架構中,他們大膽捨棄前者,只留下解碼器(Decoder-only)。事實證明,這種更精簡的架構能透過海量數據訓練出驚人的預測能力,也奠定了後來GPT-1到GPT-3的基礎。2020年GPT-3的問世證實了「模型越大、性能越強」的必然性。

到了2022年2月,微軟利用OpenAI的技術授權推出GitHub Copilot。這項基於Codex模型的工具,已能協助工程師撰寫高達20%的程式碼。證明Transformer在使用「注意力」機制時,能精準描繪不同資料點(無論是文字、程式碼或圖像)之間的關聯。緊接著同年4月,OpenAI將GPT-3的能力延伸至視覺圖像,推出DALL-E2。這引起了比Copilot更大的轟動,因為DALL-E2不僅是單純協助人類「補完」內容,而是能從零開始「創造」全新的藝術圖像。

就在全世界都在關注DALL-E2時,有傳言指出,由前OpenAI員工出走創立的競爭對手 Anthropic,正在開發一款更安全的聊天機器人(即後來的Claude)。

這激起了OpenAI的競爭慾望,2022年11月初,OpenAI高層決定採取行動。他們利用「人類回饋強化學習」(RLHF)技術,將原本稍顯生硬的GPT-3.5模型調校得更懂人類指令。執行長奧特曼(Sam Altman)敦促團隊盡快對外發布仍在測試階段的「對話介面」,既是為了即將推出的GPT-4收集更多數據,更是為了先聲奪人。

2022年11月30日ChatGPT低調上線。令OpenAI意外的是,這款產品在5天內突破百萬用戶,更在兩個月內「病毒式」擴散至1億戶大關,打破了史上所有消費級軟體的增長紀錄。


Google曾一度深陷「創新者的困境」

回到2017年,Google Brain團隊發表了劃時代的Transformer架構。這項發明的歷史意義,堪比智慧型手機的問世,但當時的Google管理層反應遲鈍。直到2019年,才僅僅將BERT(基於Transformer的語言模型)小規模導入搜尋引擎進行關鍵字的優化,完全低估了這項技術的潛力。

Google開國元老級工程師沙澤(Noam Shazeer)試圖喚醒巨人。他與同事在2020年(沒錯,比ChatGPT還早兩年!)即已開發出基於Transformer的聊天機器人—米納(Meena),並宣稱它有潛力大幅改善當時笨拙的Google助理。然而,Google高層仍舊否決了他們的成果。理由表面上是擔心AI發表荒謬言論會損害公司商譽,但更深層的恐懼其實在於:聊天機器人可能會顛覆Google賴以維生、年營收逾千億美元的搜尋廣告業務

此案例精準地詮釋了什麼是「創新者的困境」:當科技巨頭取得壟斷性規模時,為了保護現有的金雞母,反而扼殺了內部最具顛覆性的創新。這迫使它們後來只能透過模仿或直接併購,被動地回應競爭對手。

這讓人聯想到另一個經典案例:2000年代中期的Intel,當時Intel在PC與伺服器CPU領域享有極高的寡占利潤,導致它完全沒有誘因切入當時看似利潤微薄、後來卻席捲世界的行動裝置晶片市場(錯失了iPhone的浪潮)。Google在AI浪潮初期,犯了幾乎一模一樣的錯誤。

最戲劇化的轉折隨之而來。2021年,心灰意冷的沙澤憤而離職,創辦了Character.AI。隨後2022年底ChatGPT爆紅,Google則陷入驚慌,甚至急召創辦人佩吉與布林回鍋救火。

到了2024年,被OpenAI打得暈頭轉向的Google,急需最強戰力來領導Gemini。他們尷尬地發現,當年被自己氣走的人,手握最好的技術與產品直覺。最終,Google做出了一個震驚業界的決定:支付約27億美元給Character.AI的投資人。這是一場名為技術授權、實為天價的「人才併購(Acqui-hire)。繞了一大圈,Google花了幾十億美金,只為了買回當年那個原本就在自家的沙澤,讓他回鍋擔任Google DeepMind的核心領導人。

★註1: 為了集中資源發展AI,Google於2023年4月宣布將內部的Google Brain與原本獨立運作的DeepMind正式合併,重組為Google DeepMind

★註2: 本書並未收錄Google後來以人才併購Character.AI的事件;微軟在2024年3月對 Inflection AI的操作(支付6.5億美元挖角創辦人),正是近兩年矽谷「人才併購」浪潮的始作俑者。


結語

這本書講述的不僅只是商業競爭,它更解釋了為什麼如今的AI世界,最終無可避免地落入了幾家科技巨頭的壟斷之中。

最初,哈薩比斯(Demis Hassabis)創立DeepMind是為了破解人類智慧的奧秘;奧特曼(Sam Altman)與馬斯克(Elon Musk)創立OpenAI則是為了建立開源、更安全的AGI,以對抗Google在AI早期的壟斷。

然而,這兩大陣營最終都撞上了一堵無法跨越的高牆—研究人員的薪資與運算力等「鉅額成本」。隨著模型參數呈指數級膨脹,訓練一次AI的成本飆升至上億美元,這早已不是科學實驗室所能獨立去負擔的遊戲。

於是,我們看到了現代版的「浮士德交易」:DeepMind為了不讓人才被矽谷的高薪挖角殆盡(當時Facebook的祖克伯也虎視眈眈),選擇賣身給Google;而OpenAI為了獲得取之不盡的運算額度,選擇投入微軟的懷抱。

結局就是我們眼前的現實:理想主義者為了實現夢想,將靈魂(控制權)賣給了資本家。而隨著AI安全性爭議升溫,部分堅持初衷的研究員又再次出走,創立了Anthropic等AI新創公司。

這場「至高無上」的AI軍備競賽,究竟會帶領人類走向繁榮的奇點,還是失控的深淵?正如《權力與進步》一書所提醒我們的,科技發展的路徑從來不是自動造福大眾的,而是取決於「誰」掌握了方向盤、取決於「權力」的分配。這或許才是這本書留給我們最深層的啟示。

★註: 奇點(Singularity): 指一個假設的未來時間點,屆時人工智慧的智慧將全面超越人類。


最後,我會推薦這本書給誰?

  • 如果您關注輝達的股價,或是持有微軟、Google的股票,這本書是投資人的必讀教材。
推薦理由: 它不僅是在講AI技術發展,更是在解釋這場兆元級別的資本支出背後的邏輯。閱讀完本書,你會真正理解為什麼微軟執行長納德拉(Satya Nadella)願意為OpenAI掏出一張又一張的支票,甚至在2023年OpenAI內鬥時親自介入調停;以及為什麼Google寧願花27億美元買回一個工程師,雖然科技巨頭已不再創新,但它們依舊能快速行動,直接購買創新取得戰略優勢。

  • 對於那些在大型機構工作,常常感到「創新推不動」的人來說,本書會讓你心有戚戚焉。
推薦理由: 書中Google的故事是「創新者的困境」最血淋淋的現代案例。你可以看到一群擁有世界最強大腦的工程師(即Google Brain),是如何被內部的官僚主義、過度謹慎的公關策略給逼走。這是一面鏡子,讓你思考如何在組織規模擴大時,還能保有速度與彈性

  • 特別推薦給那些喜歡看《社群網戰》(The Social Network)或《賈伯斯傳》這類傳記風格的讀者。作者奧森筆觸非常銳利,她把原本枯燥的演算法競賽,寫成了一齣充滿背叛、野心與權謀的矽谷宮廷鬥爭劇,根本就是一部精彩的商戰驚悚片。


留言

這個網誌中的熱門文章

《閃電擴張》,企業如何從1到10億執行規模化?

《端粒效應》,如何用科學延緩衰老?

《細胞之歌》:我們應當試著「認識自己」