當前位置:首頁 > 軟件與服務 >

阿里公布新語音合成技術 錄音10分鐘定制AI語音

發布時間:2019-07-10 15:16:11 來源:互聯網 作者:佚名
[摘要]7月10日下午消息,阿里巴巴發布新一代語音合成技術KAN-TTS,稱可大幅提高合成語音與真人發聲的相似度,并將語音合成定制成本降低10倍以上。...
7月10日下午消息,阿里巴巴發布新一代語音合成技術KAN-TTS,稱可大幅提高合成語音與真人發聲的相似度,并將語音合成定制成本降低10倍以上。該技術由達摩院機器智能實驗室自主研發。

阿里方面稱,當前業界商用系統的合成語音與原始音頻錄音的接近程度通常在85%到90%之間,而基于KAN-TTS技術的合成語音可將該數據提高到97%以上。

據悉,KAN-TTS由達摩院機器智能實驗室自主研發,深度融合了目前主流的端到端TTS技術和傳統TTS技術,從多個方面改進了語音合成。傳統語音合成定制需要10小時以上的數據錄制和標注,對錄音人和錄音環境要求很高。從啟動定制到最終交付,項目周期長成本高。

阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的方法,將語音合成定制成本降低10倍以上,周期壓縮3倍以上。也就是說,用1小時有效錄音數據和不到兩個月制作周期,就能完成一次標準TTS定制。

此外,這使得普通用戶定制“AI聲音”的門檻更低。只需手機錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。(韓大鵬)

【返回首頁】

2013比特币行情走势图 qq麻将网页版 江苏时时百度贴吧 北京pk现场 快乐十分中奖计算器 一万期验证时时心得 怎么买新时时 马会特供资料站 吉林快3开奖结果今天 陕西快乐10分钟开奖走势图 360彩票老重庆时时彩 江西快三开奖结果查询今天 江苏时时视频 一分赛计划网 黑龙江福彩20选8开奖 湖南福彩动物员开奖公告 腾讯时时彩计划官网