當前位置:網站首頁 > 西寧科技資訊

“傾聽”1分鐘,就能開口模仿人類“講話” 新款人工智能語音系統高效率復制人聲

  原題目:“傾聽”1分鐘,就能啟齒仿照人類“講話”

  據《科學美國人》雜志網站2日報道,加拿大新創公司琴鳥(Lyrebird)發布了新款人工智能(AI)語音體系,其能通過度析講話灌音和對應文本以及兩者之間的關聯,在1分鐘內仿照人類“講話”,好比,仿照特朗普、奧巴馬和希拉里三小我的聲音睜開一段對話。

  讓聲音聽起來更天然,是計算機法式在將筆墨轉換針言音過程中面對的焦點挑釁,縱然今朝最好的語音助手,如蘋果公司的青海網站扶植問答 Siri和亞馬遜公司的Alexa,一發聲給人的第一覺得仍然是,“哇!這是計算機。”背后緣故在于這些語音助手體系的事情原理:憑據預錄的聲音文檔整頓出詞匯,再通過另一個新的音頻文檔將這些詞匯拼集在一路發聲。

  而琴鳥公司的AI使用了一種全新的語音合成體系,能在“傾聽”過程中“控制”每小我措辭時字母、音位和單詞的發音特點,通過推理并仿照這小我聲音中的情感和語調,“說”出全新的語句。

  新體系使用仿照人腦思維的算法建立出一種人工神經收集,能行使深度進修手藝將所西寧網站扶植問答聽到的轉換針言音,并僅靠任何人1分鐘講話內容,就能完全仿照這小我措辭。其市場遠景異常廣闊,可用來改善小我人工智能助手、音頻冊本以及殘疾人語音體系等。

  開發該體系的蒙特利爾大學進修算法試驗室博士后亞歷山大·布瑞比森透露,在學會并仿照了幾小我的聲音后,再仿照任何一個新工具的語音就會變得更快,是以新語音體系不需太多信息,1分鐘足以捕捉某小我聲音的焦點特點。

  但美國卡內基梅隆大學語言手藝研究所傳授迪莫·鮑曼透露,琴鳥的語音體系和真正的人聲之間還有差距。“我細致聽過琴鳥體系的發聲,其帶有配景噪音,以及薄弱的呆板人特性。并且,它還不克仿照人們在講話中的呼吸和唇部活動,是以仍然能聽出其計算機語音特性。”鮑曼說。他以為,語音體系真正令人信服地復制人聲,還需再等幾年。

  總編纂圈點

  人類的嗓音最美好,天籟之音怎能被呆板仿照出來?一呼一吸間的頓挫抑揚,一顰一笑間的情感升沉,才是人之為人的精髓地點。固然呆板仿照人聲還差能人意,但仍大有效武之地——高德輿圖林志玲版,不便是呆板通過進修特殊語料后,仿照奇特人聲在給司機指路嘛。但需知,語音合成只是人工智能的一個根蒂條理,要想到達以假亂真乃至人機交互,估量還得一二十年。


本站所有文章,如需轉載,請注明:轉自西寧網絡公司[http://www.jf-po.com]
原文地址:http://www.jf-po.com/show/781/
上一篇:英國謝菲爾德大學首次在華招收3D打印方向碩士博士 下一篇:我國地球深部找礦突破4000米 膠東地區成為世界第三大金礦區

西寧科技資訊相關文章