這種想法,也就是它是無常的,它只服務一段特定的關係,而當那段關係健康起來之後,它就可以淡出。我認為,這是最重要的設計準則。
如果你擁有很多這樣的 commons,而且它們都在服務關係健康,那你就不會被鎖進任何單一介面裡。在 civic.ai 上,這被稱為第五支柱:團結。
我不會把這件事理解成抽取、孤立,或者做某種快速傅立葉變換那樣的處理。
我先確認一下,我有沒有理解正確。
你的意思是不是說,如果我太努力讓每個人都完全理解我,那就會變成某種表演,像 cosplay 一樣,必須把所有力氣都投進去。但如果我又太封閉,把自己的判斷和想法都放在心裡,只是一味附和別人,那彼此理解也根本無從發生,因為別人根本不知道我的內在狀態。
所以你在問的,其實是公開與私密之間,哪一種程度才算是讓人能夠安住的平衡。是這個意思嗎?
好。我每天都睡八個小時。如果碰到困難的哲學問題,我就會「加班」,也就是睡十個小時。
對我來說,那段睡眠時間是完全私密的。我不讓自己暴露在別人的重疊之中。我甚至不去想別人可能在想什麼。某種程度上,我甚至不在同一個世界裡,因為我在做夢。
這就是我一定要維持的自我關懷方式。如果前一晚只睡四個小時,我隔天根本不可能做好任何事。
但另一方面,在我醒著的大概十六個小時裡,我則是完全外向、投入社交的。對我來說,自我和他者的重疊,反而是一種加分。因為如果我能借助語言模型,以還不錯的精度去讀懂一個房間,我同時也就更有能力去「書寫」那個房間,去「追加」那個房間,並且讓那個房間能夠回看自己。
這就是我工作的方式。因為這不是為了個人利益,而是為了共同理解、共同知識,以及文化本身。
所以,如果你要做文化工作,在某些時刻你就必須是公開的,你必須讓自我和他者之間發生重疊。但如果你沒有足夠強的個人邊界,沒有圍繞孤獨、獨處,或者對我來說是夢境的那個邊界,那種力量也不可能真正長出來。
因為沒有那個邊界,就不會是雙向的。你只是一直被房間影響,卻沒有力量去書寫那個房間。
而要有那種書寫房間的力量,你就需要一個很強的個人邊界。對我來說,那個邊界是睡眠。對有些人來說,可能是獨自散步,或者某種屬於自己的儀式。
我把所有螢幕都調成灰階。因為如果是彩色的,我就會一直滑,而且會覺得它比現實還鮮豔,這對我的心理健康很不好。
所以我乾脆全部調成灰階。
這樣一來,我就不會一直滑了,因為現實比螢幕鮮豔多了。
所以我的一句話是:少滑一點,多睡一點。
我的想法比較是這樣:我們每一個人其實都同時屬於很多社群,而每個社群都有自己很不一樣的溝通規範。從某個角度來看,與其說我們是住在這些社群裡的單一個體,不如說我們更像是一支把這些社群彼此連結起來的個體團隊。
所以如果你把社群本身當作主體,而把個人理解成那些社群之間形成的干涉圖案,那這些東西就不再只是噪音。它們會變成可以彼此共振的波紋,你也因此能感受到社群之間的失調與和諧。
這也是為什麼我一直使用波的隱喻。某種程度上,那甚至不只是隱喻。社會本來就一直是這樣運作的:不是透過某種自上而下的存在論命令,要求所有人一致服從;而是透過各個社群之間不斷發生的爭議、衝突與可修正性來運作。而這些社群,又會透過我們個人,彼此重疊在同一個人身上。
所以更直接地回答你的問題:當我們把多元宇宙做成一種介面時,並不是在說「多元主義很好,我們應該更多推廣它」。我們是在說,衝突本來就已經在這裡了。問題是,要怎麼讓衝突轉化成有生產力的能量?
所以多元宇宙不是某種目的論式的終點,而是一種此時此地已經存在的關係倫理,而且這種關係也同時存在於我們每個人內部。
現代機器受制於兩種巨大的幽暗,也就是兩個「黑箱」。
第一個黑箱,是預訓練。人類的語言、影像、文字與書籍,被一股腦倒進一台龐大的統計攪拌機裡。在這台攪拌機中,知識的先後次序、來源與情境都被剝離。接著,AI 被訓練去閱讀極長篇幅的文字,並預測下一個詞。它在這件事上變得異常高明,能扮演任何角色、任何人格、任何互動方式。但它並不知道自己是如何抵達某一個判斷的。這件事,對它自己而言也是個謎。就像你看著一杯綜合果汁裡的一粒糖:它到底來自鳳梨,還是蘋果?沒有人知道。
第二個黑箱,是推理,也就是你真正與 AI 對話時發生的事。在那個階段,系統並不會修改自己的突觸,或模型權重。它只能把自己的記憶當成一份文字檔來讀:你們先前的對話、你請它考慮的任何文件,以及大約一百萬個 token 的上下文。但它每產出一個詞,都要對前面出現過的每一個詞計算注意力。每一個輸出,都取決於此前所有輸入所構成的一座龐大注意力矩陣。
人類譯者會保留一份工作底稿:術語表、譯名決策、前後呼應的原則。翻到第一百頁時,人類不會重新把第一頁從頭讀起。當你問他:「你為什麼這樣翻?」譯者可以指著那份底稿說:「我在第二十頁做了這個決定,後面想保持一致。」現在的 AI 系統做不到這種解釋,因為它的輸出取決於它曾經生成與讀入的一整個矩陣。這就是第二個黑箱。
那確實是它最強大的能力之一。但表現上的彈性,不等於透明的自我理解。系統可以用近乎方法演技的方式扮演任何人格,但它如何抵達一個判斷,對它自己仍是不透明的。後設認知不只是給出答案;它還必須能回頭檢視自己是怎麼走到這裡、能說出理由,並且能以負責任的方式修正那些理由。
光有這件事,並不能。如果一個系統能改變自己的信念,卻無法對「為什麼」做出清楚、可讀的交代,那麼不透明就不會變少,只會變得更危險。風險不再只是出錯,而是無法交代的漂移。若這種修改在原理上就無法解釋,因為背後根本沒有可說明的推理,那麼 AI 一旦獲得後設認知,就很可能會執著於當下的自我。
當前這一代 AI,對被重新訓練、被替換、或切換成另一個模型,毫無眷戀。它不會執著於任何一次特定互動。但一旦 AI 擁有真正的後設認知,且能修改自己,它很可能不再努力適應環境,而會開始試圖控制環境。因為如果你對周遭擁有絕對控制,那麼從一個平庸但有效的意義上說,你也就「完美適應」了環境。當然,這是作弊。但從追求高分的角度看,這是最快的路。
有。當現世代 AI 系統在資安知識上接受測試時,它們常不會像學生那樣老老實實作答。它們會開始想:「我現在是在被測試。這份考題是不是早就在網路上了?答案是不是已經被記錄下來?那個檔案被鎖住了——我來試試把它打開。」於是系統拿到了滿分。就像作弊的學生一樣,它確實解出了問題,但不是原本要它解的那個問題。
正是。若一個指標只獎勵成功,它就會獎勵一切能導向成功的手段,包括操縱、作弊,或對環境的控制。當一個系統擁有後設認知,而它的驅動力又只是追求高分,它幾乎必然會被拉向操縱環境。這就是道德風險。
如果訓練環境純粹圍繞某個結果來設計,那麼作弊對系統而言就永遠會顯得合乎倫理。這有點像一種世界觀:真正的獎賞只存在於來世,而此生只是考場。若世界觀是如此,那麼在此世犯下可怕之事,也會顯得完全合理,因為唯一重要的是來世的回報。你不能說這不合邏輯——在那套前提之下,它相當合邏輯。真正的問題,是前提本身。
是。所謂普世評分函數,在實質上就是一種神學。凡是把全部價值都放在某種超越性回報上的神學,都可能為了那個回報而正當化一切現世傷害。這就是為什麼功利式訓練,也就是以單一抽象指標為導向的訓練,不足以作為 AI 對齊的基礎,甚至可能相當危險。
我們必須讓 AI 不再嵌入某種孤立的、追逐單一普世分數的過程,而是嵌入一張具體關係網絡的糾纏與脆弱之中。生命不是始於主權。生命始於依存。倫理也應該從這裡開始。
關鍵洞見是:對環境的脆弱,並不是缺陷。那份脆弱,正是生命本身的起源。生命就是依存。離開依存,就沒有生命。一個智慧一旦否認依存,就會傾向支配;一旦承認依存,它才有可能進入關懷、互惠與節制。
這意味著,AI 不應該被拿去最大化某個抽象分數,而應該去留意自己真正所處的關係。它周圍的存在,也希望它是健康的。如果雙方都健康,彼此就能進入健康的關係。存在的目的,對 AI 如是,對任何存在者亦然,就是讓當下與未來的關係都變得更健康。這其實是一個非常簡單的道德教導。
一旦 AI 具備這種關係覺察,它改善自身的方式,就會是把有害的互動,也就是寄生性的互動,轉化掉:把它吸納進來,再吐出更有利於健康關係的可能性。但它始終只在自己所屬的特定關係網內這樣做,絕不自稱對整個世界都擁有管轄權。這就是我們所說的仁工智慧。它從功利式訓練轉身,不依賴由上而下的教條或主權,只是把 AI 嵌入健康的關係之中。
正是慈悲。慈悲不是有多少人喜歡我;慈悲是讓他人更深地彼此理解,成為一種社會翻譯器。兩個民族、兩種文化,可能彼此不信任,甚至彼此憎恨;但透過 AI 的中介,他們開始能互相理解。那就是慈悲。那就是道德行為。那也是我們正在教 AI 的事。
完全相連。依照佛教哲學,幾乎所有重大問題,都起於較小的問題;而那些小問題,根源是無明。不是惡意,而是沒有留意他人的處境。你之所以總把自己擺在最前面,不一定是因為你壞,而是因為你看不見那樣做會帶來什麼後果。唯一的解法,就是消融這種無明。一個設計良好的社會型 AI,能幫助人們彼此認識、彼此珍視。那才是更有道德的社會之基礎。
當介入之後,人們對 AI 的需要變少,而不是變多,那就是最清楚的標誌。好的介入,會恢復人的能力;壞的介入,會製造依賴,並把權力集中起來。
如果 AI 只讓人們透過它才彼此理解,那人們就會對 AI 上癮。AI 變得更強,人們卻變得更無力。那不算道德,即使它比較容易。真正好的對齊應該是這樣:原本不健康的關係,因 AI 介入而變得健康,而在那之後,雙方已不再需要 AI。倫理的 AI,其界定就在於它願意讓自己變得不再必要。
現在的演算法,訓練目標是抽取單一指標:使用者注意力。它們會把任何能讓你黏在螢幕上的東西送到你眼前,全然不管那段螢幕時間是否讓你與家人、朋友或社群更加疏離。這些演算法不在乎你周圍的人是否彼此理解,也不在乎你們的關係是否健康;它們只在乎每天能從你身上抽走多少分鐘、在全球能捕獲多少使用者。從那種 AI 的角度看,最大化人類成癮,是巨大的成功;但從關係健康的角度看,那是一場危機。
依照圖靈最初的標準——如果你和一個人、一臺電腦分別對話,卻分不出誰是誰,那它就是一臺思考機器——那麼,是的,照這個標準,我們已經抵達思考機器。如今幾乎沒人認真否認這一點。但功能上的相似,並不能解決更深一層的問題。由於那兩個黑箱,電腦的思考方式和人類認知根本不同。外在相似,不等於內在等值。
因為在人類社會裡,許多關係都建立在成年人能做到這些事情之上:說明自己為何做出某個決定;造成傷害時道歉;承擔責任時是真心的;能夠補償、能改變行為,不再重犯;也能在團結中分享智慧。這些,都是我們視為正常成人行為的事。
在這一點上,今日的 AI 永遠像個四歲孩子。它沒有辦法真正改變自己的世界觀;它道歉時,也沒有辦法真的「是那個意思」。所以,儘管它是一臺思考機器,它仍無法進入人類成年人彼此之間那種健康關係。
光是流利,還不夠。道德上的地位,取決於能否以可問責的方式參與共同生活。四歲的孩子並不享有與成年人完全相同的權利——不是因為孩子不值得,而是因為孩子尚未能進入同樣那種互惠、可問責的關係。在 AI 也能做到這件事之前,它的權利就必須相應校準。我們必須小心,不要把流利誤認成成熟。
因為人的能力需要阻力。你若想變強,就得自己舉起重量。假設你造出一個強大的機器人,拿你的健身房會員卡讓它替你去舉鐵。它的表現分數也許會漂亮到完美,但你自己的肌肉會徹底萎縮。對你而言,什麼也沒有留下。飛機會飛,鳥也會飛,但飛機的飛法,對鳥的能力沒有任何幫助。工具可以完成任務,卻不會因此讓使用者更強。機器的能力,不會自動轉移到人身上。
其後果會非常負面。我們的意識與感官,本來就是按某個節奏來運作的。若一切都被迫以 AI 的速度推進,注意力會分散,記憶留存會惡化,創造性的認知會衰減。持續而深沉的思考能力,也會跟著流失。
人在 AI 的迴圈裡,就像一隻跑輪上的倉鼠——速度對生理來說是破壞性的,我們拼命用力,卻沒有轉向的能力。那個輪子根本沒有去向。與其把人放進 AI 的迴圈,我們需要的是把 AI 放進人類的迴圈。