每一年,無一例外。
你們每年也都來臺灣。
這是一個很強的召集場域。我剛剛才和 Channing 說,把那些從非常不同起點思考 AI 的人聚在一起,是多麼好的一件事。
有些人幾乎完全從數學角度來思考 AI。對他們來說,「對齊」好像是一個可以用公式解出來、寫個 QED 收尾的問題;解完之後,就能做出百分之百可靠的 AI。另一些人則更貼近地面現場,連結到政策、競爭、制度等等。
三年前,這些人通常不太說同一種語言。但現在,因為 SCSP 以及這類聚會的召集力,越來越多人看見,真正的 AI 系統對齊,也關乎系統周遭的社會基礎設施與公眾覺察。今天,這種覺察已經到了一個很高的程度。
但我們確實有把臺灣日作為 Day 0 的一部分。
在 Day 0,我特別喜歡和 Anka Lee(前國防部副助理部長)的對話,談的是 AI 採用周圍的公民層,也就是必須圍繞 AI 採用建立起來的公民肌力。在英國,有些人把這稱為「肌力採用」(muscular adoption)。
這個想法很簡單。與其假設雲端某處會有一個巨大的 AI 系統,所有人都去訂閱它。大家現在開始看見,這其實不一定是好方向。訓練一個超級巨大的模型,又摺疊蛋白質、又摺衣服、把所有東西都摺進巨大的不透明盒子裡,這不一定是社群真正需要的。
我們現在看到的,更多是狹義 AI、邊緣 AI,以及特定領域的 AI。這些系統讓人們可以依自己的需要來調校工具。
最近一個很好的例子,是 OpenAI 與 ROOST 的 安全防護模型(safeguard model) 工作。這個模型可以在超音速情境,把一項 AI 決策,和一組預先核准的規則進行比對,判斷該自主行動是在邊界之內,還是超出邊界。
重要的是,這種 AI 很小,而且可解釋。它可以指出,這項行動究竟符合或違反預先核准協議中的哪一部分;無論是戰爭部,或任何其他使用者,它都能迅速完成判斷。這讓幾年前還只是推測的用途,現在變得可以實際運作。
過去幾年,我去了 28 個國家,但我沒有時差,只有「飛行能量補充」(jet boost)。不過,這不是因為智慧體 AI,而是因為 Timeshifter 這個應用程式,它會透過光照、咖啡等提示,幫助我改變睡眠模式。
這其實也連回剛才的重點:有用的系統,是一個具體、範圍明確的工具,照料一種具體的關係。
幾年前,臺灣線上深偽詐騙大幅增加。我們沒有說,審查要由政府從上而下來做。相反地,我們使用所謂的「 仁工智慧 」(Civic AI):特定的智慧體工具,一次聆聽大約十個人,找出他們之間的罕見共識。
舉例來說,社群媒體公司在臺灣要負連帶責任:如果它們刊登未經請求、沒有數位簽章的廣告,而那則廣告是深偽,導致人們損失數百萬,平台就必須賠償。
我們也有一條規則:如果境外社群媒體公司無視這些責任規則,那麼它們每無視一天,我們就可以把連線速度降低百分之一。
但同樣地,這不是內容審查。重點在於,仁工智慧幫助我們顯示出,廣大公民對於一項實用的防詐規則有廣泛共識。它協助摘要、翻譯,甚至進行社會翻譯,讓不同意識形態的人,都能用自己的語言看見同一個共識。
沒錯。那是在 2024 年,我們制定了那部法律。到了 2025 年,臺灣的深偽冒名詐騙減少了超過 94%。所以這個問題幾乎已經解決。
因此,我們開始把這個想法輸出到其他地方。現在在日本,不只是自民黨,還有一個新的政黨 Team Mirai ,也把這種「廣泛傾聽」作為政黨平台的一部分。人們( DD2030 )現在也正在訓練這類邊緣 AI 系統,用來做不涉及審查的詐欺偵測。
同樣的廣泛傾聽,現在也在加州。就在昨天,加州政府 啟動了 Engaged California 這個傾聽實踐。如果你是加州居民,也可以參與這項廣泛傾聽,分享你對 AI 自動化如何影響工作的擔憂。
而且問題不只是工作本身,也包括學徒制、歸屬感、社群與尊嚴。透過這個流程,可以找出加州人民之間的罕見共識,進而為可能的法律回應,也可能是經濟回應,提供依據,讓前沿實驗室能有所回應。
我很樂意。
我認為這種焦慮當然是有道理的。因為許多人第一次接觸到強大的 AI 推薦系統,是在社群媒體上。
大約十年前,我們開始看到,這些系統推送大量未經請求的資訊,只是為了讓我們無止盡地滑下去;這就是透過激怒來達成互動。我們也看到,即使人們發文說:「親愛的演算法,我不想看到這個,我想看到那個」,演算法也沒有反應。
所以可轉向性非常、非常低。它試圖偵測所謂的顯示性偏好,也就是「我會對這類內容上癮」;但我們的陳述性偏好,例如「我不想對這個上癮」,卻完全被忽略。
正是因為這些 AI 模型缺乏可轉向性,許多人自然會害怕。
在臺灣等地,我們用廣泛傾聽與仁工智慧,真正把系統導向人們想要的方向。例如 Uber 演算法就是如此。但在其他沒有這類轉向機制的地方,人們當然會害怕。
過去幾年,我許多工作都是與各個前沿實驗室合作處理這個問題。例如,Anthropic 質性訪談了 81,000 人,精確詢問他們對 AI 系統的恐懼與期待。OpenAI 和 Anthropic 也都發布了它們的模型規格或憲法。
現在的問題是:我們如何把迴路閉合?一旦人們說:「好,模型規格的這一部分我們不是很滿意;也許它不該這麼諂媚,不該這麼奉承我們」,那麼實驗室究竟要如何回到我面前說:「好,這些文字因為你的意見而改變了」?
所以我認為,模型規格或憲法的可轉向性,是下一個重要前沿。它能讓人們把恐懼與焦慮,轉化為集體能動性與公民肌力。
我會說,是社群之間的社會翻譯這個想法,現在才剛要出現。
幾週前,X 推出了協作式備註。以前,如果你在 X 上看到一則有爭議的貼文,通常要等幾個小時,才會有人寫出社群備註,釐清脈絡。現在,他們訓練 Grok,讓 Grok 可以在社群之間進行翻譯。
例如,它可以在氣候正義社群與聖經受造關懷社群之間翻譯,寫出一則兩邊都能接受的備註,讓雙方都看見,這則備註是在對他們兩邊說話。
過去,這種中介工作——幾乎像是在締造和平——對執行的人來說非常耗力。但現在,Grok 可以以工業規模來做。研究已經顯示,當人們能夠導向 Grok 的草稿時,人們會變得較不極化。
這個模式現在正在擴散到 Bluesky,也希望能擴散到 Truth Social 以及社群媒體的其他角落。我認為,這種由 AI 中介的社群媒體體驗,終於讓真正的利社會媒體有可能發生。
這就像營火,對吧?它讓人們更清楚地看見彼此。
不像現在這種野火,每個人都在對著彼此的影子揮拳。
明年見。
近來從矽谷科技公司到其他大型企業,愈來愈多組織開始把 AI 使用與績效評估連動。許多人為了職場求生,被要求投入大量時間與資源,學習與 AI 協作。
但不少人很快發現,這些嘗試未必讓工作更順利,反而像是在服膺某些「預言」。
例如:「AI 會成為你最親密的工作夥伴」、「每個人都會有 AI 助手」、「不導入 AI 的企業將被淘汰」。這些話看似描述趨勢,實際上卻在規訓行為:你最好現在就交出注意力與判斷權,否則就是落後於時代。
我在牛津的同事 Carissa Véliz,在新書《Prophecy》中提醒,預言的力量不在於說中未來,而在於塑造未來。
例如,有企業主相信「AI 將取代八成人力」,於是調整績效制度、重組團隊,最終裁掉大半員工。這不是預言準確,而是自證預言。
人一旦接受「不可避免」的語氣,就會開始調整行為,成為推動預言的一部分。
但台灣其實很熟悉如何推翻這種敘事。八〇年代,技術密集產業被認為不可能在台灣發展,如今我們有了台積電;疫情初期,也曾有人預測台灣撐不過第一波。後來證明了,很多的「不可避免」往往只是當時看似合理的劇本。
面對預言,重要的永遠是我們選擇如何回應。
若相信可以改寫,就會開始尋找協力者。無論半導體產業或防疫經驗,都是靠集體行動來推翻預言。
那麼,「AI 淘汰人力」是否不可避免?
作為基礎設施,AI 的確可能因為愈多人使用,而降低某些協作門檻。但當 AI 議題變成焦慮製造機時,真正該問的問題是:我們究竟要用它來做什麼、為誰而做,以及應該守護哪些價值?
這也是為什麼矽谷企業開始邀請哲學家參與 AI 對齊、安全與制度設計。當人們對 AI 產生情感依附,或開始討論機器是否有意識,這些都不再只是工程問題,而是我們想成為什麼樣的社會。