所以他們組成小型對話圈。然後 AI 從這裡截取一段、從那裡截取一段,做成混編。它們抹除了實際的聲紋模型,但保留了語調和情感,讓你仍然能感受到另一群人的情緒。但你不知道誰在說話。你甚至不知道他們的口音。
j 下一段next speechk 上一段previous speech