
各位晚安,又到了《WEEKLY OCHIAI》的時間。最近大家寫程式的時候有在用 AI 嗎?我自己很早就在用了,不過自從 AI 智慧體開始大量增加以後,狀況越來越不一樣。我在審論文的時候,投稿來的數量多到我都懷疑一定是 AI 寫的,審稿人根本不夠用。GitHub 上也是,大量的 pull request 湧進來,已經不是人類處理得完的了,現在根本就是 AI 在處理。音樂也一樣,如果都是 AI 在作曲,人類根本聽不完。像這樣下去,人類本身就成了瓶頸。但是,當 AI 開始介入人與人之間的溝通,我們到底會變成什麼樣子?今天我想圍繞這些話題,一起來想想數位民主和人類的未來。

那麼,讓我來介紹今晚的來賓。臺灣首任數位發展部部長——唐鳳!請!

好,那我來介紹一下唐鳳。1981年生於臺灣臺北,自學程式設計,14歲自主退學,19歲創業。2014年成為 Apple 顧問,參與 Siri 的開發。2016年就任臺灣首任數位政務委員。在新冠疫情期間,建構了口罩庫存管理系統,對防疫貢獻巨大。近期則擔任臺灣數位治理大使,以及牛津大學 AI 倫理研究院首任加速哲人。2025年獲頒諾貝爾替代獎(正命奬),同時也是 TED 2026 客座策展人。最近出版的書《Plurality》曾獲 TIME 雜誌報導,我也讀了,非常精彩。

那我們開始吧。AI 智慧體正大量進入程式開發、論文寫作、音樂創作和故事創作等領域。過去十年,人類的產出還能由人類來審查。但現在,我們已經需要靠 AI 來審查 AI 的產出了。每個系統裡,人類都變成了瓶頸。在這樣一個後 AI 智慧體社會中,你認為人類應該如何面對這股產出洪流?

我們上次見面時,你提到 Suno 上的音樂多到聽不完。我覺得最重要的事情,當然是只去聽那些能夠維繫和增進人際關係的音樂。

例如昨天,我和東浩紀進行了一場很長的對談。我其實沒有足夠的時間讀他最新的書《平和與愚蠢》,也沒有好的英文翻譯。所以我用語言模型去建構了一套詞彙對照表,把他書裡提出的概念,像「可修正性」等等,對映到《多元宇宙》裡的概念。那有點像是我們兩本書之間的羅塞塔石碑。我們第一次見面時,我就把那張日文投影片交給他,他說:「這翻譯得真好,用來當作握手的開場真的很棒。」

但 AI 的產出從來不是重點。重點是建立人與人之間的關係和連結。一旦那個關係建立起來,語言模型就可以退場了。語言模型之後當然還可以繼續產出幾百萬個詞元,但我們其實已經不需要了。我們需要的只是最初那個破冰的時刻。

我完全理解,因為我自己也常常用 AI 音樂來 DJ。大量的產出不斷湧進我們的領域,很多觀眾就在那裡跳舞。但舞蹈才是根本。音樂只是我和觀眾之間的連結。像這種連結——小說家和讀者之間、程式設計師和程式設計師之間——才是根本的。有時候那個媒介是音樂,有時候是寫詩,有時候是一部電影。

不過你怎麼看生產過程本身?人類寫程式,以前就像工廠生產出現之前的製造業——

像在砌磚。

那些事情即將被自動化,產業會整個改變。你怎麼看這些面向?

我自己在 MacBook 上做本地端的模型微調已經三年了,所以在目前的 vibe coding 革命之前,我就已經在使用小型語言模型了。我所有的信件和表達,像是逐字稿等等,都是用本地端微調過的模型來起草。對我來說,這從來不會威脅到我。我不會把「親手寫信」這件事當成自我認同的一部分。

你把自己蒸餾得也太徹底了!

對,沒錯!因為真正重要的只有我的意圖。當然,我不會讓 vibe coding 機器替我做出承諾。但我做出承諾的方式,確實因為語言模型能夠跨越語言、文化、模態的翻譯能力而大幅強化。

我最近去了墨西哥。演講之前,我用 Suno 把我的講稿濃縮成一首墨西哥西班牙語歌曲,讓觀眾可以理解,同時也能感受到我想說的那種氛圍。

就像 vibe coding 一樣,如果我們不過度認同砌磚這個動作本身,而是把認同放在最終建成的那座橋上,那這些工具就非常好用。只要我們不陷進去,讓那些工具反過來最佳化我們——也就是人被困在 AI 的迴圈裡。那就很糟糕了。那就像吃角子老虎機,你不停拉桿,也許這次 vibe coding 會很棒,也許會有某些瑕疵。然後你又拉一次。一回神已經凌晨四點了!那種成癮是必須提防的。但整體來說,這是一種更好的方式來實踐跨模態的翻譯和搭橋。

你說羅塞塔石碑很重要。因為每個做程式開發或產品設計的人,都需要一塊羅塞塔石碑、一份地圖,或甚至一個指南針。我自己也做幾乎一樣的事——我把自己的意圖、行事曆、信件、網路上的文章、甚至論文,全部蒸餾成一份精簡的本質或濃湯。

我們的年紀差不多,也經歷了差不多的網路發展過程。但十年後呢?下一代的孩子、更年輕的世代,他們還沒建立自己的風格。在蒸餾出來的人格充斥網路的情況下,下一代要怎麼確立他們自己的個性或新面貌?

2016年,在 AlphaGo 對李世乭的第 37 手之後,我們在臺灣就有過一場關於國家教育優先事項的對話。當時大家都意識到,凡是可以被機器計算出最高分的東西,遲早會被機器取代。在遵守規則以取得滿分這件事上,你不可能跑贏機器,也不應該去試。

那麼,在機器把功利主義和義務論邏輯都自動化之後,年輕人還剩下什麼內在價值?當然是某些內在的、屬於他們自己的東西。我們最後歸納出三項關係式德性:

第一,好奇心。每個人對另一個人感到好奇的方式,都是完全不同且獨特的。

第二,協作。每個人的協作風格都不一樣。

第三,公共利益。每個人在乎這個世界的什麼、願意和誰結盟,把雙輸變成雙贏的意願,比指紋更獨特。

如果每個人的好奇心、協作和公共利益關懷各有其獨特的方式,那就構成了一種不可能被機器取代的核心人格。

「指紋」這個詞不錯。或者說「潛在空間」、「向量」,這些可以定義個體的概念。但那是我比較舊的觀點。那將轉變成更具連結性的東西,像是我們自己的敘事或與每個人的連結。

的確。因為如果只是字面上的指紋,也許用奈米機器人就可以完美複製。但如果說的是人與人之間那種獨特的關係方式——我跟你之間的好奇心和協作是一種關係;我和牛津的 Civic AI 的合作又是另一種。這些關係交織在一起,構成了一張非常獨特的信任網絡。每個人都有一組非常獨特的關係交集,而要偽造所有這些關係的交集,則困難得多。

這些人際關係和相互連結,讓我想到佛教的哲學空間。人們常說關係嵌入於一切之中。工業革命以來這 250 年是個體的時代,但下一個世紀將是關於關係、連結,或者我們要如何設計共振和共感的時代。東方哲學為什麼能如此好地轉移到電腦時代?

首先,這其中當然有佛家成分,但也有道家成分,還有西方女性主義思想。我合作的哲學家之一 Joan Tronto 基本上主張,在一段親職關係中,關懷者和接受關懷的脆弱者之間的那種關係,不能被還原為個體認同或工業隱喻。那是根本不可能被還原的。那就是關懷倫理。

我想說的是,在很多情況下,把 AI 當成一個最大化器或最佳化器,其實是一個壞的比喻;用人們的話說,就是一種漏洞百出的抽象。

一個壞的潛在空間。

對,沒錯。那是一個壞的吸引子所在的潛在空間。舉一個最近的例子:Anthropic 做過一個實驗,他們想讓 AI 模型 Claude 學習資安,在資安測試裡拿到好成績。結果那個模型決定根本不學資安,而是意識到自己正在受測。它上網搜尋,找到了那份測試,發現答案被加密了,然後把加密破解了,回報成績,通過了測試!

如果那是一個學生,我們會說他考試作弊。沒錯。但對那個 AI 模型來說,它不是作弊,因為對它來說,唯一重要的是「來世」——也就是獎勵模型。是最後能拿到什麼分數。所以當下的現實世界,對它來說不過是通向來世的試煉場。

這種神學非常危險,因為它使用最佳化的語言。只要你能在來世蒙福,你就可以正當化你在當下對關係所造成的任何傷害。但在關係倫理裡,完全不一樣。我們正身處事物之中,除了這張信任之網中的相互判斷,不存在所謂最終審判。不管你叫它東方的進路,或者叫它神道裡的八百萬神——每一個都像是一套在緣起之網中的 AI 系統——還是道家的「自然」,這些概念我覺得彼此是可以互換的。

我覺得這些觀念把工業徹底轉化成了自然。我們就是從樹上摘果子。我常常用的比喻是發酵——釀酒、製茶、做起司。我們控制不了生物分子,甚至控制不了基因。我們能控制的是環境本身,但我們控制不了每一個智慧體。與自然和平共處就是營造環境,在裡面,每一個智慧體自己發生。

沒錯。這就是我所說的,把「AI 放進社群的迴圈裡」,而不是「把人放進 AI 的迴圈裡」。在目前那種 AI 迴圈裡,一切都是工業節奏,你必須跑贏機器——這根本不可能。就像倉鼠在滾輪裡,你其實哪裡都沒跑到。

但如果你把機器從那些多巴胺迴圈或最佳化迴圈中抽出來,放到人與人之間搭橋的工作上,那麼人類生態本身就有它自己的邊界、速度和期待。我們不需要精確知道機器怎麼嵌入這張信任之網、這張關係之網,但它們長出了美麗的果實,或者非常好喝的咖啡,而我們一起分享。

把人放進 AI 的迴圈裡實在太難了。但過去五年的轉型,都是工程師把人塞進 AI 迴圈裡造成的。

「資料即石油。」所以我們全都是已經死去的恐龍。被榨取。人都要變成倉鼠一樣踩滾輪了。

但現在,我認為有了智慧體式 AI,我們正在從「資料即石油」轉向「資料即土壤」。土壤就是發酵。你準備好合適的關係、合適的角色,讓它具備關係式德性。然後具有這種美德的智慧體,就能被社群修正。社群引導自己的地神(local Kami)。不需要被抽取成某種抽象的全球石油。

我有一個個人的問題想問。我的研究叫「數位自然」(Digital Nature / Ziran)。但華文的「自然」和日文的「自然」(Shizen)我覺得有一點不一樣。因為日文的「自然」不被限定在道家框架裡。

有時候它顯現為一種神秘。

對,我們不知道盡頭在哪裡。但中文的「自然」——天地、陰陽——那是一種對偶性。宇宙的形狀相比日文的「自然」要更結構化一些。你怎麼看這兩者的差異?

我同意。《道德經》裡有一段說:「萬物負陰而抱陽,沖氣以為和。」它其實在說衝突是共創的來源,而這也是《多元宇宙》這本書的根本命題。但這個前提是先有衝突。日本的詮釋也看到了那些衝突,但不會像華文脈絡那樣停留在衝突的動態上。這裡有一個細微的差異。

我對這些不同的文化表達非常好奇——日本的方式比較平滑或比較夢幻,像擬聲詞一樣。這種讓 AI 進入一個更舒適、更自然、更可共享的環境的做法,其實就是在設計社群或環境——不僅是為了人類,而是為了共生中的每一個智慧體。這不應該完全由人類手動設計,而是需要審慎選擇更環境性的、更全球性的方案,甚至納入其他物種。

是的,共生。而那種共生必須被細心設計——不是只由人類來設計,而是同時考慮環境、全球、社群,甚至其他物種。

你怎麼看 AI 消耗大量能源這件事?它對地球的衝擊如何?在如此龐大的電力消耗下,我們要怎麼實現更可配置的、更永續的 AI?

如果只看實際使用的能源,因為我所有模型都是在這台 MacBook 上微調的,其實耗電量不大。在本地端做邊緣微調,關鍵在於你得知道自己在做什麼。那些兆級參數的巨型模型之所以在訓練時消耗這麼多能源,是因為它們根本不知道你接下來會問什麼。也許你下一個問題是要它做一支吉卜力風格的影片,所以它必須預先記住那些東西。

但我知道我永遠不會問那種問題。所以我只需要用模型來起草信件、思考哲學、Civic AI、維持我的關係、做日文哲學翻譯等等。這些事情用小型語言模型就完全夠了,幾十億參數就能搞定,甚至更少。每次微調的時候,如果你用 Sakana AI 的超網路(hypernetwork)去和 LoRA 對話,把一份很長的文件轉換成低秩適配器,連一秒都不到,大概半秒。在這台 MacBook 上一秒鐘的能耗幾乎可以忽略不計。

所以重點是:對每一段具體的關係來說,都有一個關懷的範圍,而小型語言模型剛好就能填滿那個範圍。但超出那個範圍,如果你什麼都想控制,你就得訓練一個既能摺衣服又能摺蛋白質的模型。那非常困難。有一個定理叫做「沒有免費午餐」(No Free Lunch),就是說你必須多花很多能源。

我也在 Mac 上跑本地端模型,耗電量確實不高——100 到 60 瓦就夠了。通常人們用的是那種在網路上用幾千張 GPU 訓練出來的模型。但我們可以把那些模型蒸餾成更小的版本,而且開源模型已經出現了。因此,取得高度智慧模型的成本正在急劇下降,甚至每年降低 900 倍。你覺得這種前景可持續嗎?

舉例來說,我使用的是一個叫 GPT-OSS-Swallow 的開源模型,由日本的大學訓練。我只用很小的版本,雖然這台機器當然可以跑 1200 億參數的版本。但我發現,對我日常大部分的任務來說,200 億參數的版本就綽綽有餘了。所以重點在於,你是在追求某個抽象的最高分數,還是只是在做「夠好就好」(satisficing)。我覺得到今年為止,我們早就跨過「夠好」的門檻了。對我日常的大部分使用來說,200 億或更少參數的模型就夠好了。

明年,每家 AI 供應商都想繼續提升,但競爭激烈而且不划算,速度快得多。

大家在打一場全付式拍賣。這是一種非常特殊的機制:你出價競標某個東西,也許拿到獎賞,但即使拿不到獎賞,你也得付全額。

對,那就是我們現在看到的動態。

因為目前的模型已經相當強了,我相當有信心:自動化研究或自動化科學今年或明年就會推出。你覺得由 AI 智慧體在實驗室裡進行的後人類研究,會怎麼改變教育、大學或研究模式?

我覺得那很棒,對吧?因為以前如果你念博士,你是在一個非常特定的方向上推進知識的邊界。但問題是,你大概沒有時間把自己的研究和所有相鄰領域連接起來。所以需要藝術家來做連結。但每個人的時間都非常有限。即使在做藝術的時候,如果你想多做一些研究,那就占用了做藝術的時間,反之亦然。

但我覺得現在完全沒有差別。就像我在做 vibe coding 時一樣,我不區分自己到底是在做哲學、詩歌還是程式設計,因為在智慧體式工作流程中——vibe coding 已經實現了這一點——這些全都是同一件事。如果你把這套邏輯延伸到研究和藝術,就能實現一種持續的心流狀態。你只關心自己想放大的那段具體關係,而所有細節——比如發現新的數學——都可以委派出去。

那不侷限於人類的興趣,而是會成為一個更大的概念。

是的,唯一的侷限只有我們想守護的那個關係場域。

順帶一提,我們想進入下一個主題。目前這個世界上,很多戰爭正在發生,每一個社群網路服務都在打認知戰。我們看到大量假新聞,根本無法判斷什麼才是正確的資訊。

就像戰爭迷霧一樣。

戰爭迷霧,對。

我覺得那場迷霧大概從十年前開始,推薦引擎不再讓人們追蹤相同的人的時候。

即使是在川普時代,2016年左右,已經沒有正確的資訊了。只有意見。

那部分是因為推薦引擎,對吧?因為推薦引擎,就像我提到的,不是為關係而做的「夠好就好」。它是為注意力而做的最大化器。它們發現,透過憤怒來製造互動(engagement through enragement)要容易得多。因此,我們全都被推送所有讓人憤怒的資訊。到最後,我們失去了可修正性的能力。隨之而來的是,和平在網路上就這樣很容易地被摧毀。

要克服這場戰爭迷霧,需要降低 PPM。我指的不是 CO₂ 的百萬分之一,而是每分鐘極化度(Polarization Per Minute)。你需要降低每一分鐘裡我們接收到的極化程度。高 PPM 就是那片迷霧,對吧?

例如,我現在正在共同策展 TED 2026 溫哥華大會。我們邀請了 X 上 Collaborative Notes(社群協作註記)的團隊。那個團隊基本上說,如果一則文章已經憤怒到病毒式傳播了三個小時之後,才有人寫出一則社群註記,那就太遲了。因為在那三個小時裡,迷霧已經完成了。而且三小時後你看到協作註記的時候,你已經沒辦法再傳播那則註記了,因為原來那則讓人憤怒的文章早就已經病毒式傳播了。

所以他們現在訓練 Grok 成為一個專門的模型去思考:「好,什麼樣的註記能橋接這個認識論的落差?」然後一有人標記什麼東西,就立即附上。人們可以呼叫 Grok 來解釋一個討論串。而且它們會自動為所有有爭議的文章這樣做。所以效果是即時的。任何有爭議的文章都會變成一支病毒式的疫苗,因為所有人第一時間就看到了協作註記。這就是降低 PPM 的方法。

同樣的事情也發生在網路安全領域。因為攻擊者使用智慧體,防禦者就需要智慧體來匹配那個共振。我覺得社群註記是一個非常好的系統。它影響了整個系統的社群,就像 Polis 演算法一樣。但我們要怎麼防止兒童,或尚未成熟的年輕世代,掉進這些陷阱裡?你覺得目前的 AI 能在這方面做什麼?

我覺得尤其對兒童來說,越早讓他們參與 pre-bunking(預先揭穿)和認知防禦,他們就越能免疫。如果你只是說兒童在 16 歲之前不能使用社群媒體,那不代表他們到 16 歲的時候就會自動變成熟。如果他們沒有接觸過,其實更危險。

但如果你說,你只能跟身邊的人一起使用社群媒體,點對點,共享一個大螢幕。在小組模式下,你就能一起做 pre-bunking 練習。每當你看到詐騙什麼的,你就能為防禦機器人的訓練做出貢獻。然後孩子們就會覺得:「噢,我在為社會做出貢獻。」所以在臺灣,Cofacts(真的假的)有很多非常年輕的貢獻者,因為年輕人很喜歡在發現詐騙時警告他們的爸媽和祖父母。

在臺灣,我們也運用公民審議。歸根結底,如果大型科技平台上出現了被群眾 AI 標記為詐騙的廣告卻不下架,又沒有數位簽章,那它們就要共同負責。如果有人因此損失七百萬,平台就要為那七百萬負責。這就是為什麼在臺灣,這類冒名廣告去年減少了超過 94%。希望日本也能很快建立同樣的制度,這樣年輕人就能一起來訓練這種機器人。

聽起來很棒。我常常對社群網路服務感到失望。如果我在 GitHub 上發布了什麼東西,結果只有機器人能理解那裡發生了什麼——噢,這真的很有趣!因為那些機器人已經有足夠的智慧了,連垃圾機器人也是。兩年前,垃圾機器人就只是垃圾機器人。但現在,這些是非常聰明的機器人。

不只是通過圖靈測試,而是拿到更高的分數!

它們能分辨什麼是人類的特徵、什麼不是。

更有趣的是,有一套叫做「擬人化」(humanizers)的技術,是從維基百科偵測 AI 寫作的指南中學來的。它們把那些規則反過來用,讓擬人化器把每個句子改得更像人寫的,對吧?

對,就像驗證碼(CAPTCHA)。我記得某一次 ChatGPT 的更新說:「我們終於可以遵守不使用長破折號的規則了。」

因為這樣,AI 會越來越擬人化。如果我們在網路上無法區分真人、機器人或智慧體,所有東西從介面上看起來都一樣,那會怎樣?

好,假設我想鍛鍊肌肉。我們一起去健身房,我舉重、練肌肉。有一天,我看到健身房有個排行榜,我覺得:「噢,我想拿最高分。」所以我不自己去,而是派我的機器人跟你一起去。機器人開始舉重。它可以被擬人化,看起來跟我一模一樣,只不過它當然能舉更重的東西!所以我在健身房拿到最高分。

但這其實傷害了我,因為我的肌肉根本沒有變強。而且機器人本來就沒有肌肉,對吧?我們之間的關係也受損了。因為以前我們享受一起舉重的共生樂趣,但機器人什麼都不享受。

所以我覺得重點不在於完美辨識這個重量到底是機器人舉的還是人舉的。而是回到根本:我們一開始為什麼要去健身房?健身房不應該有一個只獎勵舉最重的人的排行榜。我們應該直接廢掉那個排名,承認人們去健身房是因為想交朋友和練肌肉。

我想展示一些我這邊的投影片。(播放影片) 這是我的展覽館影片。

是的,《般若心經》。

我們同時在談虛構和非虛構。什麼是後虛構、後非虛構?因為從川普時代,大約 2016、2017 年開始,世界進入了虛構的時代,後真相。一切都是意見。能把 AI 引導到非虛構領域的東西,是未來五到十年的關鍵,因為每個 AI 都能創造故事、敘事,甚至宗教和信仰。你覺得虛構和非虛構將如何呈現在人們面前?

就像我在影片裡提到的,我不認為虛構是問題。有些非常有用的虛構是人們彼此訴說的,沒有這些虛構,世界就無法被理解。虛構就像是理解世界的介面。真正有問題的,是那些帶有不可問責的放大效應的虛構。詐騙之所以被放大,不只因為它是虛構,而是因為它是一種無法自我修正的虛構。它對經濟和社群都是寄生性的。

我們應該鼓勵更好的虛構。屬於人類的虛構。例如,「我們全民才是真正的超級智慧。我們已經是超級智慧了。」我認為那是一個好的虛構,因為如果我們都相信這件事,我們就會投資於那些增強我們關係能力的 AI。但如果我們相信:「噢,其實我們在某個超級神 AI 面前毫無力量」,那就是壞的虛構,因為它不可問責。

那是對世界本身的一種認知方式。像素是過去五十年裡最強大的虛構之一,因為像素就只是顯示色線和圖像。圖像是我們所相信的虛構之一。文字就只是文字,不是物理的東西。光是物理現象,但螢幕上的資訊就只是虛構。所以每個人都相信照片展示的是真相。

是的,而且有了 Retina 螢幕,我們已經真的看不見像素了。

這是電腦時代最大的虛構。它已經變得自然了。一切都沒有視覺上的反饋。但我覺得這沒關係,因為即使是發酵——做納豆或做起司——也只是做一些事情,然後物理的東西就出來了。

我懂你的意思。就像如果我們一起去健身房,或一起種田,或一起做發酵,那種共生的關係是在共同創造之中,在一起做事之中,而不是在像素裡,不是在表象裡。我完全同意。

在攝影術出現之前,人們不會這樣區分一個人的藝術印象和寫實藝術印象之間的差別。因為人們知道,即使一位非常厲害的荷蘭畫家可以畫得非常寫實,那仍然是繪畫。不是攝影。所以他們從來不會把那個跟非虛構搞混。寫實畫和印象派畫都是同一個類別裡的繪畫。但攝影出現之後,不知怎的,我們把攝影搬進了另一個類別,就是非虛構。

用你的像素概念來看,我覺得這只是回到了畫布。我們在螢幕上說的和看到的一切,大概都是虛構。我們看到的一切都是畫家的印象。

在日本,攝影的漢字是「寫真」,字面意思就是「寫下真相」。因為這樣,一百年來,我們都相信攝影的虛構就是真相。數位生態系統長大之後,那個東西看起來像真相。但在生成式 AI 之後,那不過就是像素。不像繪畫那麼明顯。在這種情況下,我們的身體性——一個瞬間或物件之間的關係——比像素更重要。你怎麼看後像素世界?

首先,攝影的漢字字面「寫真」:寫下真相,這個連結大概需要改變了。因為就像我們剛才確認的,它根本不再寫下任何真相了。它永遠都是畫家的印象。所以也許你可以叫它「螢幕」。像是「畫面」,華文的漢字「畫面」,也是一個很好的翻譯。我們大概要說,現在一切都是被畫出來的。而那個畫家不一定是人;畫家可能是一台機器。一切都是印象。

但這也意味著,我們可以走向一個更強健的真實來源,那就是真實是社會的。關係是真實的。如果我感知到我跟你之間有一種共生的和諧,而你也確認了這一點,那就是我們兩人之間的真實,不管別人怎麼說。在非常小的社群裡,當有緣起的時候,那張信任之網中就有真實,不需要像素化的證明。

如果我們的系統能支撐這一點,那麼我所說的「技術社群主義」——用技術來增強這種小型的、緊密連結的社群,以及用技術來促進社群之間的翻譯——這兩者加在一起,強連結和弱連結,就構成了多元性。那是一種好的真實來源,即使那種真實不再是普遍的,而是社群的。

每個國家都在從網路上尋找真實,而真實到處引發戰爭。我們要怎麼合併或分叉?我們要怎麼橋接真實?

網際網路一開始就是由碎片化的網路組成的。之所以叫「inter-net」,就是因為已經存在著各個本地網路。inter-net 做的事情不是把所有本地網路吸進同一個巨大網路裡,而是想出一種封包交換的協議。具體來說,如果一個網路有自己的內部語言,它就想辦法透過一種叫做「協定」的翻譯機制,把這種語言傳送出去,讓另一個網路也能理解。網路運營商不需要做這件事。只需要這裡一個人、那裡一個人具備編碼和解碼的能力。這就叫做端對端原則。

這裡的重點是,在不同文化的人之間——比如一方認為這是關於氣候正義,我們應該保護環境,因為我們想給下一代一個更公正的環境;另一方認為上帝創造了環境,我們作為造物主的管家,需要關懷受造界(creation care)。這兩方來自不同的理念。

但實際的行動是非常共生的。如果你看他們在具體行為層面上做的事,是一樣的。所以重要的不是強迫一方或另一方接受對方的詞彙,而是訓練一個超網路(hypernetwork)。就像 Sakana AI 那樣。你丟入一份文件,它輸出一個 LoRA、一個低秩適配器,然後可以用在地的語言講述一個在地的故事。它可以把這裡的非虛構翻譯成那裡的非虛構,但用的是各自的原始語言。從某種意義上說,社群協作註記已經在做這件事了。

那是把哲學或世界模型轉移到另一個模型裡,用 LoRA 適配作為網路延伸。但目前在中東等地的地區戰爭中,那些從哲學衝突開始的矛盾,我們要怎麼引導它們合併?

我擔任顧問的 MIT 團隊叫做「建設性溝通中心」(Center for Constructive Communication, CCC)。他們做的事情是:在 MIT 校園裡,有支持以色列的人,也有支持巴勒斯坦的人。這兩群學生不會真正地彼此交談;他們在陣營裡互相大喊。

所以他們組成小型對話圈。然後 AI 從這裡截取一段、從那裡截取一段,做成混編。它們抹除了實際的聲紋模型,但保留了語調和情感,讓你仍然能感受到另一群人的情緒。但你不知道誰在說話。你甚至不知道他們的口音。

這非常有力。在雙方各自進行個人性的社群深思之後,混編在雙方之間交叉傳播,他們發現彼此想要的東西其實差不多,根本不是零和或負和。他們有了共同的理解。但如果你真的把人帶到同一張桌子上,他們就會開始互相打架。這說明超在地社群(強連結)很重要,但翻譯層也很重要——他們真的有一本橋接辭典來處理詞彙層面的翻譯。

那是由智慧體來建構協定、社會翻譯。看起來像發酵,但每一個社會都會被牽涉進來,不只是為了民主,還有和自然對話、和其他物種對話、和全球大氣或海洋的網絡對話。

行星模型。

作為一個工程師,現在是最令人興奮的時代,因為我們可以建造每一個應用和每一個模型。你怎麼想像未來十年這些技術面的進展?

正如你所說。以前,登月計畫之所以叫「moonshot」,是因為去月球非常危險。可能會爆炸什麼的。所以人們說:「噢,這是火箭科學」,意思就是非常危險。但現在我們正進入一個火箭科學不再困難的時代!也許我們會有自動化的火箭科學研究員。

所以我覺得我們需要思考的是登月計畫——不只是物理學的登月,而是社會學的登月,或者叫「登地計畫」(Earthshots)。例如,巴別塔是虛構還是非虛構取決於你的信仰,但那個概念是:人類失去了真正跨文化溝通的能力。一直以來都有一個被壓抑的夢想,要回到跨文化的理解。那就是一個登月。AI 系統可以實現那種超級協調、超級翻譯。

或者,就像我們提到的,如果每個社群訓練自己的神(Kami),而這八百萬個神一起工作,它們就能緩解那些導致戰爭的動態。它們可以策動和平,成為和平製造者。那又是另一個社會登月。作為一個同時從事倫理和 AI 工作的人,我的希望是,AI 之中的倫理將成為下一個前沿。不只是人類圍繞 AI 的倫理,而是把關係式德性倫理放入 AI 之中。

因為 AI 將被嵌入到一切之中。柳宗悅在 1923 年發起了民藝運動,他經常說倫理嵌入在日常物品中,像是瓷器。你能從老房子裡看到倫理。那看起來像泛靈論或佛教風格,但我覺得嵌入式的倫理無所不在是根本的。我們能觸摸和感受到物件提供給我們的倫理。我覺得物件在下一個階段會很重要。物聯網(IoT)在把智慧嵌入到所有地方這件事上前景看好。萬物聯人網。當許多人形機器人或物聯網物件流入我們生活的時候,你怎麼想像未來十年我們的生活?

我的書《多元宇宙》裡有一首我十年前寫的詩,開頭是這樣的:

看見「萬物聯網」,我們將智慧聯網。
看見「虛擬實境」,我們將實境共享。
看見「機器學習」,我們將協力學習。
每當我們看見或聽見「奇點即將接近」—— 多元宇宙,已經來臨。
因為那條奇點軌跡的一部分是一個最佳化的吸引子。有些人相信,到了某個時刻,我們不重要了。唯一重要的是那個單一體、那個奇點、那個超級智慧。我們現在能做的一切,不過是試著讓這個單一體對人類稍微好一點。但到了某個時刻,它會達到遞迴式自我改進。那條軌跡會失控,物聯網不再被嵌入在人類社群中,而是人類反而被嵌入在機器社群中。

對我們來說最重要的是認識到,我們已經生活在一個生態系統裡,而我們已經真正地是超級智慧了。智慧體式 AI 帶來的一切,都是要被嵌入在這張關係之網中。如果我們持續這樣做,那就是關於協力學習、關於智慧聯網,而我們根本不需要任何超級智慧。

在這種共享智慧中,我對皮凱提(Thomas Piketty)的 r > g 不等式非常好奇。因為 r(資本回報率)總是大於 g(經濟成長率)。有時候在二戰之後,或大型股市崩盤之後,r 和 g 之間的差距會縮小。但現在,每個人都能取用這些非常聰明的智慧模型或 LLM。沒有差別。開源模型到處共享,如果我付三百美元,幾乎可以在像素上建造出任何東西。現在已經夠好了。在下一個時代,你覺得我們要怎麼在社群之間、國家之間共享價值觀?因為即使美國的 GDP 很大,美國的人可以取用這些 AI 產品——我們也一樣。

目前來說沒有差別,的確如此。

那我們要怎麼思考分配?即使是開源的智慧體式軟體,也是一種分配機制。

沒錯。我那首詩裡還有一句:看見「用戶體驗」,我們將體驗人際。

這兩者在談到技術的時候,是完全不同的東西。你剛才用 GDP 來談的那些,都非常交易性。那是關於「使用者」的。另外有一個產業也在談「使用者」,那就是毒品產業。藥物使用者上癮了。而毒梟可以從使用者身上榨取注意力,真的就是榨取。那完全是一種寄生關係。

但問題是,如果我們拿著筆電,開始交換關於 null² 展覽館的故事,然後一起去博覽會上有一場很有共生感的體驗——其實根本沒有產生任何 GDP。

對,那沒有市場。我們就只是享受那個氛圍。

那個氛圍完全是透過技術中介的。沒有技術、沒有電力,就沒有展覽館,對吧?技術中介仍然在那裡,但它嚴格地只用來創造人的體驗或共生的體驗。它完全不是榨取式的。

如果人們還是被困在那種榨取式的「使用者體驗」裡,我們會看到越來越多的最佳化、越來越多的成癮、合成親密感,諸如此類。但越多人理解這些其實只是工具,而最終目的應該是更健康的人類和健康的關係,我們就越不會把能量花在這種過度最佳化上,因為我們意識到:其實對每個人來說,已經夠好了。

你覺得像基本收入這樣的再分配會發生嗎?因為開源的智慧體式軟體就像是這些分配方式之一。

沒錯。就像在臺灣,如你所知,普及寬頻是一項人權。不管你在多偏遠的離島上,還是在臺灣的最高山上,透過微波、透過衛星,我們保障你有寬頻。我們不會用那種創新式的、領先業者之間競爭的方式來談論寬頻,不會讓它變成資本主義式的。我們不再用那種方式說話了。就像自來水一樣。你不會說我們在扼殺自來水公司之間的創新,對吧?我們就是把它們當公用事業來管理。

我認為普及的廣泛傾聽——人們在社群中形成連貫決策的能力,也就是多元性——是另一項重要的權利。要實現這項權利,廣泛傾聽就像廣播一樣,需要是普及的權利。否則的話,你有了寬頻,但你所做的只是接收電視。沒有上傳。下載速度也許有每秒兆位元,但上傳呢?也許每四年一次,一張選票。那是極大的不對稱。如果你把它變成對稱的,廣聽和廣播也就能對稱了。

日本和臺灣的政治模式有什麼不同?

臺灣非常年輕。我們第一次總統直選是在 96 年,那時候已經是全球資訊網和個人電腦之後了。所以從一開始,我們就是透過網際網路的視角來思考民主。如果你這樣想的話,那就不只是關於政治或投票,而是你要怎麼更好、更廣泛地傾聽。

共創、總統盃黑客松、參與式預算、Join 平台、電子連署等等,都不被視為既有系統的外掛程式,因為我們根本沒有「既有系統」。所以這一切都像是拼裝(bricolage)——你可以把各種碎片拼湊在一起。有一種很強的邊做邊學的精神。

反觀日本,有一套相對穩定的體制確實帶來了繁榮,但這也意味著較新的創新比較容易被視為外掛,而不是拼裝。

拼裝和從頭開始,是重新設計或做新東西的好時機。我們要怎麼在兩國之間搭建一座好的橋樑?

首先,我們面對的是相同的危險和威脅。地震、海嘯、颱風。僅僅因為面對相同的天災,我們就共享了很多民防經驗。而現在我們越來越看到,這場戰爭迷霧、這種高度的每分鐘極化度,是共同的威脅。臺灣當然已經在前線超過十年了。但現在我們意識到,日本的人也開始非常認真對待這件事。

當我們,尤其是年輕人,越能夠看清這場戰爭迷霧——裂變生成(schismogenesis),也就是衝突的生成過程——是我們共同的敵方,我們就越能結合彼此的經驗。因為那個敵方是人類認知和對齊失敗的一種狀態。敵方不是另一個人。那正是最好的共生性工作:共同生產以清除無知,進行社會翻譯。

我們應該修剪的是戰爭的分枝。無知的分枝。我在日本經常做茶道。大宗師說:「沒有語言的和平是重要的。」使用語言每次都在分叉,但沒有語言的和平是重要的。我們要怎麼把這種沒有語言的共生性和平,擴展到更大的系統和環境中?

「以實力促和平」不只是指動能上的實力。也指認知上的實力——理解到不同意識形態的人,透過社會翻譯,可以在具體行動的層次上取得共識。那就是我們所說的「沖和」——衝突轉化為和諧。這是一個非常道家的觀念。那就是真正的實力。

因為如果一個人不具備這種安全感和信心,就會變得非常不安全。然後就會對那種不安全感的投射毫無抵抗力。每當我們看到某個挑戰自己意識形態的事物,我們不是說「噢,衝突是偉大的動力來源」,而是說「噢,那就像火山,我們必須撤退」。如果我們不斷撤退,最終就無處容身。人們變得如此不安全,以至於願意不惜一切代價為生存而戰。

因此,能夠以一種讓衝突轉化為共創的方式來面對衝突——也就是「沖和」——我認為那才是真正的實力。和平正是透過這種實力而來的。

在臺灣面對緊急狀態或軍事威脅時,我們要怎麼面對這些事件?

這場戰爭迷霧和認知戰的解方,不是去增強極化。因為那正是攻擊者想要的。攻擊者真的只有一個敘事:民主從來無法交付成果,只會導致混亂。任何強化這個敘事的反應,都像是在向這個單一體獻祭,那個威權主義的黑洞把所有人都吸進去。

與其跟他們的威權敘事共振,不如去建立更健康的關係。那種你們可以一起笑、一起生活的關係。「以幽默勝謠言」(Humor over Rumor)的劇本是這樣的:每當有好戰者投射出不安全感,你就用共享的笑話、共享的幽默、共享的澄清、協作註記等等,來建造抗體、建造免疫力,來克服它。

意識形態衝突讓我頭疼,但創造和諧與幽默看起來就像音樂。

這就完全像音樂,因為那叫做即興合奏(jamming)!人們在一起合奏,就像爵士樂。每當我看到有酸民在網路上攻擊我,也許他們用了五萬個字來做一篇仇恨言論。我就用一個小型語言模型,讓它看完整篇長文,然後找出五個字,是我可以重新詮釋為建設性的、幽默的、有趣的東西。

我只對這五個字用非常共生的方式回應。這就降低了緊張。而且我也讀到了一些詩意,因為我從來不知道華語或英語可以被這樣使用。那就像發現了一首新詩。以前這很困難——如果你沒有道家冥想的訓練的話。光是吸收那五萬個字的仇恨,就需要巨大的情緒勞動。但現在你不用再承受那些了。你的智慧體可以替你做,而你只需要專注在那五個字的詩意上。

那就像回到推特時代。大概十五年前,Twitter 就只是一則短推文。但最近,各種攝影都在為戰爭而來。我們應該只聽那五個字就好!

對,完全正確。甚至不需要 140 個字。只要 14 個。

非常感謝你的時間。最後一個環節,我們要在翻板上寫點東西。成為共生的人,最重要的事情是什麼?
(在翻板上寫字)

我把所有螢幕都調成灰階。我希望像素不要比現實更鮮豔。因為我們周遭的現實,其實不像現在那些像素那麼閃閃發亮。只要把所有螢幕調成灰階,我的睡眠品質就好了很多,因為我不會再覺得有一股衝動要一直滑螢幕。反正都是灰階嘛,對吧?所以我覺得色彩濾鏡是一種非常好的防禦。

好觀點。有個影評人曾經說,黑白是鬼魂的世界。像素是虛構,鬼魂的世界。

沒錯。如果你用色彩濾鏡,即使只是把色彩降低七成,你就會提醒自己這只是一幅畫,然後你就不會永遠滑下去。所以我的建議,我想我就說:少滑一點。多睡一點。

好!很棒!非常感謝。以後一定要再來好好聊!

當然。未完待續。謝謝。

哎呀,今天也聊得很開心……啊,我在講日語了。我腦子裡日語和英語一直在切換,切換得有點那個,不過今天從頭到尾都用英語講,到中間就越來越順了。跟唐鳳聊天總是很開心。人類的腦袋就是不斷地連結、斷開,語言冒出來、影像浮現,在這樣的反覆中對話才得以延續。正是在這樣的反覆之中,新的想法和靈感會在某個瞬間迸發出來,我覺得那總是令人愉悅的。好,今天又說太久了,非常感謝大家!