阿里新一代語音合成技術公布,可將語音合成定制成本降低10倍以上
來源: 編輯:vbeiyou 時間:2019-07-10 07:17人閱讀
非常在線2019年7月10日消息,阿里巴巴發布了最新一代的語音合成技術KAN-TTS,據稱該技術可大幅提高合成語音與真人發聲的相似度,并將語音合成定制成本降低10倍以上。
KAN-TTS由達摩院機器智能實驗室自主研發,深度融合了目前主流的端到端TTS技術和傳統TTS技術,從多個方面改進了語音合成,據阿里方面介紹,目前商用系統的合成語音與原始音頻錄音的接近程度通常在85%-90%之間,而KAN-TTS可以將該項數據提高至97%以上。
除了聲音的相似度得到提升以外,這項技術還有兩大提升,一個是制作周期較短相對于傳統語音合成周期壓縮三倍以上,另一個就是成本降低,使用KAN-TTS語音合成定制成本將降低10倍以上。
目前該項技術已經向B端客戶開放使用,可以基于5大場景、提供34種不同的聲音,企業也可以與個人定制其專屬“AI聲音”目前該技術已經應用于高德地圖、天貓精靈等應用上面。后期個人用戶將也可使用這項技術,只需要提供十分鐘手機錄音,就可定制“AI聲音”獲得與錄制聲音高度相似的合成語音。
文?|陳晟,非常在線原創,專注于科技、金融、教育、游戲、互聯網等領域。新聞熱線:029-88866445轉806

分享到:
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com
標簽:
阿里