許多人仍認為人工智能(AI)生成的語音聽起來“機械感”明顯,但英國倫敦瑪麗女王大學研究團隊在新出版的《公共科學圖書館·綜合》雜志上發(fā)表論文指出,AI語音合成技術已進入新階段,其生成的“克隆語音”或深度偽造聲音,逼真度與真人錄音無異。
研究團隊采用當前最先進的AI語音合成工具,生成兩類合成語音:一類是基于真人錄音的“克隆”聲音,旨在模仿特定說話者;另一類則由大型語音模型生成,不針對具體個人。參與者被要求辨別聲音的真實性與可信度。
盡管研究未發(fā)現(xiàn)AI聲音存在“超真實效應”(即比真人更像真人),但結(jié)果顯示,“克隆語音”的逼真度已與真人聲音不相上下,令人難以分辨。且部分AI生成的聲音在可信度評價中甚至超越了真人錄音。
研究團隊表示,AI語音已滲透日常生活,如Alexa、Siri及各類客服系統(tǒng)。雖然當前系統(tǒng)音色仍具機械特征,但自然度接近人聲的AI語音技術已然成熟。利用商用軟件僅需幾分鐘真人錄音,即可快速、低成本地生成高質(zhì)量聲音克隆,且?guī)缀鯚o需專業(yè)知識。
最新研究顯示,公眾對高仿真語音認知機制的研究迫在眉睫。AI語音技術的飛速發(fā)展有望給教育、人機交互等領域帶來創(chuàng)新機遇——在這些領域,定制的高質(zhì)量合成語音可增強用戶體驗。但是,合成語音也對倫理、版權和安全構成挑戰(zhàn),尤其在虛假信息、詐騙與身份冒用等方面需加強防范。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2025 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務業(yè)務經(jīng)營許可證060344號主辦單位:《中國高新技術產(chǎn)業(yè)導報》社有限責任公司