阿里新一代語音合成技術公布，可將語音合成定制成本降低10倍以上

來源：編輯：vbeiyou 時間：2019-07-10 07:17人閱讀

非常在線2019年7月10日消息，阿里巴巴發布了最新一代的語音合成技術KAN-TTS,據稱該技術可大幅提高合成語音與真人發聲的相似度，并將語音合成定制成本降低10倍以上。阿里新一代語音合成技術公布，可將語音合成定制成本降低10倍以上(圖1)

KAN-TTS由達摩院機器智能實驗室自主研發，深度融合了目前主流的端到端TTS技術和傳統TTS技術，從多個方面改進了語音合成，據阿里方面介紹，目前商用系統的合成語音與原始音頻錄音的接近程度通常在85%-90%之間，而KAN-TTS可以將該項數據提高至97%以上。除了聲音的相似度得到提升以外，這項技術還有兩大提升，一個是制作周期較短相對于傳統語音合成周期壓縮三倍以上，另一個就是成本降低，使用KAN-TTS語音合成定制成本將降低10倍以上。目前該項技術已經向B端客戶開放使用，可以基于5大場景、提供34種不同的聲音，企業也可以與個人定制其專屬“AI聲音”目前該技術已經應用于高德地圖、天貓精靈等應用上面。后期個人用戶將也可使用這項技術，只需要提供十分鐘手機錄音，就可定制“AI聲音”獲得與錄制聲音高度相似的合成語音。文?|陳晟，非常在線原創，專注于科技、金融、教育、游戲、互聯網等領域。新聞熱線：029-88866445轉806