阿里達摩院發(fā)布新一代自研語音AI芯片技術


來源:中國產業(yè)經濟信息網   時間:2019-08-22





  在美國舊金山舉行的芯片行業(yè)頂級學術會議HOTCHIPS上,阿里巴巴達摩院發(fā)布了新一代AI語音FPGA芯片技術——Ouroboros,該技術能將語音生成算法的計算效率提高百倍以上。這是業(yè)界首款專用于語音合成算法的 AI FPGA芯片結構設計。

  作為芯片領域的頂級峰會之一,HOTCHIPS 與其他頂級半導體會議的顯著區(qū)別之一就是更側重于商業(yè)應用,而非僅僅是學術項目,此次阿里發(fā)布的Ouroboros 就是面向語音合成領域商業(yè)應用的 FPGA 加速計算方案。

  針對 ASIC 實現(xiàn)的性能仿真預估表明, Ouroboros 的設計可以實時運行 WaveNet 等業(yè)界先進的文字轉語音(TTS,Text-to-Speech)算法 ,實現(xiàn)實時語音合成。

  算法很好但難以進行實時計算是語音芯片的行業(yè)難題。Ouroboros的突破在于它使用了端上定制硬件加速技術,替代云端服務器,有效避免了對網絡連接和云端服務的強依賴性,解決了這一問題。以計算量最大的AI語音合成算法WaveNet為例,為了生成1秒的語音,CPU和GPU需要消耗50秒的計算時間,但Ouroboros在FPGA環(huán)境下只需要 0.3秒,大大提升計算效率,同時將整體服務成本降低 10 倍以上。

  阿里用戶在使用天貓精靈、高德導航、智能點餐機等服務時,將率先得到媲美真人語音交互的體驗。

  阿里發(fā)布的 Ouroboros 技術,同樣適用于達摩院于今年 7 月發(fā)布的新一代的語音合成算法KAN-TTS。該算法將商用系統(tǒng)里的合成語音與原始語音的相似度提高到97%以上,是目前業(yè)界體驗最好的語音生成算法。自研算法與自研AI芯片設計的結合,意味著阿里在語音生成領域實現(xiàn)了真正的“軟硬一體化”計算結構的落地。

  據(jù)了解,Ouroboros 芯片技術除了語音合成之外,還將支持AI語音識別?;?Ouroboros 研發(fā)完整的語音AI芯片,有望率先在天貓精靈上落地。


  轉自:TechWeb

  【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業(yè)經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯(lián)系:010-65367254。

延伸閱讀

  • 阿里云supET平臺獲評世界互聯(lián)網領先科技成果

    阿里云supET平臺獲評世界互聯(lián)網領先科技成果

    11月7日在第五屆烏鎮(zhèn)世界互聯(lián)網大會上,阿里云牽頭建設的supET工業(yè)互聯(lián)網平臺當選為世界互聯(lián)網領先科技成果,也是唯一獲獎的工業(yè)互聯(lián)網平臺。
    2018-11-21
  • 中國鐵建試制成功世界最高效率清篩機

    近日,鐵建裝備與奧地利普拉塞-陶依爾公司聯(lián)合開發(fā)生產的QS-1200Ⅱ全斷面道砟清篩機通過試用評審,該設備是目前世界上作業(yè)效率最高、自動化程度最高、回填效果最佳的枕底清篩機,突破了目前我國鐵路大修清篩的瓶頸。
    2017-03-21
  • 中國海油物探技術獲行業(yè)性突破

    近日,中國海油所屬中海油服對渤海兩區(qū)塊的寬頻地震采集資料的處理工作漸近尾聲,這是中海油服物探事業(yè)部自主研發(fā)的水平纜寬頻地震采集處理技術的首次應用。
    2017-03-21
  • 全球首條量子通信商用滬杭干線全線接通

    近日,隨著上海漕河涇、松江大港等量子通信中繼站的啟用,全球首條量子通信商用干線——滬杭干線全線正式接通。滬杭量子通信商用干線的接通,將實現(xiàn)杭州和上海兩地間的量子安全級別語音電話、視頻電話、文件傳輸業(yè)務。
    2017-03-22

熱點視頻

多措并舉穩(wěn)外貿 動力強勁底氣足 多措并舉穩(wěn)外貿 動力強勁底氣足

熱點新聞

熱點輿情

特色小鎮(zhèn)

?

版權所有:中國產業(yè)經濟信息網京ICP備11041399號-2京公網安備11010502035964