OpenAI推出聲音克隆新技術:復刻你的聲音僅需15秒
來源:快科技 編輯:非小米 時間:2024-03-31 16:42人閱讀
快科技3月31日消息,據媒體報道,OpenAI公司最近推出了一項革命性的聲音克隆技術——“Voice Engine”。
據悉,Voice Engine通過文本輸入和15秒的音頻樣本,便能生成與原始說話者聲音極為相似、情感豐富且自然逼真的語音。
這一技術的研發始于2022年,并已應用于公司現有的文本轉語音API和Read Aloud功能中的預設語音。
OpenAI認為,Voice Engine技術對于多個領域具有重大意義。在閱讀輔助和語言翻譯方面,它能夠提供更為自然的語音輸出,增強用戶體驗。
同時,該技術對于言語障礙患者來說更是一大福音,能夠幫助他們更順暢地交流。例如,在布朗大學的一個試點項目中,該技術成功用于創建從學校項目錄制的音頻中提取的語音克隆,有效幫助了言語障礙學生。
然而,鑒于合成語音技術可能存在的濫用風險,OpenAI目前僅對少數可信合作伙伴開放小規模測試。通過這種方式,公司旨在深入了解技術的潛在應用,并評估可能帶來的風險。
OpenAI也希望通過此舉引發社會對合成語音負責任部署的廣泛討論,共同探索如何適應這一新型技術。
此外,為了確保技術的安全使用,OpenAI還采取了一系列安全措施。這些措施包括使用水印技術追蹤音頻來源,以及對系統的使用方式進行主動監控。
當產品正式推向市場時,公司將設立一個“禁止語音列表”,以檢測并阻止與名人聲音過于相似的人工智能生成聲音,從而避免潛在的版權和隱私問題。
分享到:
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com