《Tech Times》by Joseph Henry on February 17, 2022
初創公司Sonantic展示了其AI擬人配音技術的能力,所開發的深度偽造音訊可以和人開玩笑或者調情。
Sonantic實際研發的產品是一個音訊編輯器,該編輯器內含有不同的語音模型,基於實際的配音演員聲音開發。現在開發的合成音訊可以和人進行交流,在加入非語音的音訊後,發出的音訊更像是人的活動而產生的。在開發語音時,透過模擬加入了細微的情感,公司稱為音訊的PS,所能表達的情緒有歡喜、傷悲、害怕、憤怒等,更不用說和人開玩笑、調情。該公司主要和娛樂工作室合作,但是也和賓士合作幫助車載資料助理。
Sonantic的深度偽造音訊是建立在機器學習上的一個重大進展,對於以後在若干方向的發展有重大意義,包括遊戲、娛樂。開發者透過聲音的型別來獲得注意力,讓聲音根據場景更為獨特、適合。深度偽造的聲音不但可以用來模擬人的講話,也可以用在壞主意上。駭客可以使用這個技術騙銀行工作人員,有報道說有人使用人工智慧增強的聲音盜取了銀行3千5百萬美元。針對深度偽造,中國官方增加了對人工智慧技術的監管和對社交平臺的監控。