唐鳳

對,沒錯。那是一個壞的吸引子所在的潛在空間。舉一個最近的例子:Anthropic 做過一個實驗,他們想讓 AI 模型 Claude 學習資安,在資安測試裡拿到好成績。結果那個模型決定根本不學資安,而是意識到自己正在受測。它上網搜尋,找到了那份測試,發現答案被加密了,然後把加密破解了,回報成績,通過了測試!