在美國(guó)舊金山舉行的芯片行業(yè)頂級(jí)學(xué)術(shù)會(huì)議HOTCHIPS上,阿里巴巴達(dá)摩院發(fā)布了新一代AI語(yǔ)音FPGA芯片技術(shù)——Ouroboros,該技術(shù)能將語(yǔ)音生成算法的計(jì)算效率提高百倍以上。這是業(yè)界首款專用于語(yǔ)音合成算法的 AI FPGA芯片結(jié)構(gòu)設(shè)計(jì)。
作為芯片領(lǐng)域的頂級(jí)峰會(huì)之一,HOTCHIPS 與其他頂級(jí)半導(dǎo)體會(huì)議的顯著區(qū)別之一就是更側(cè)重于商業(yè)應(yīng)用,而非僅僅是學(xué)術(shù)項(xiàng)目,此次阿里發(fā)布的Ouroboros 就是面向語(yǔ)音合成領(lǐng)域商業(yè)應(yīng)用的 FPGA 加速計(jì)算方案。
針對(duì) ASIC 實(shí)現(xiàn)的性能仿真預(yù)估表明, Ouroboros 的設(shè)計(jì)可以實(shí)時(shí)運(yùn)行 WaveNet 等業(yè)界先進(jìn)的文字轉(zhuǎn)語(yǔ)音(TTS,Text-to-Speech)算法 ,實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音合成。
算法很好但難以進(jìn)行實(shí)時(shí)計(jì)算是語(yǔ)音芯片的行業(yè)難題。Ouroboros的突破在于它使用了端上定制硬件加速技術(shù),替代云端服務(wù)器,有效避免了對(duì)網(wǎng)絡(luò)連接和云端服務(wù)的強(qiáng)依賴性,解決了這一問(wèn)題。以計(jì)算量最大的AI語(yǔ)音合成算法WaveNet為例,為了生成1秒的語(yǔ)音,CPU和GPU需要消耗50秒的計(jì)算時(shí)間,但Ouroboros在FPGA環(huán)境下只需要 0.3秒,大大提升計(jì)算效率,同時(shí)將整體服務(wù)成本降低 10 倍以上。
阿里用戶在使用天貓精靈、高德導(dǎo)航、智能點(diǎn)餐機(jī)等服務(wù)時(shí),將率先得到媲美真人語(yǔ)音交互的體驗(yàn)。
阿里發(fā)布的 Ouroboros 技術(shù),同樣適用于達(dá)摩院于今年 7 月發(fā)布的新一代的語(yǔ)音合成算法KAN-TTS。該算法將商用系統(tǒng)里的合成語(yǔ)音與原始語(yǔ)音的相似度提高到97%以上,是目前業(yè)界體驗(yàn)最好的語(yǔ)音生成算法。自研算法與自研AI芯片設(shè)計(jì)的結(jié)合,意味著阿里在語(yǔ)音生成領(lǐng)域?qū)崿F(xiàn)了真正的“軟硬一體化”計(jì)算結(jié)構(gòu)的落地。
據(jù)了解,Ouroboros 芯片技術(shù)除了語(yǔ)音合成之外,還將支持AI語(yǔ)音識(shí)別?;?Ouroboros 研發(fā)完整的語(yǔ)音AI芯片,有望率先在天貓精靈上落地。
轉(zhuǎn)自:TechWeb
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65367254。
延伸閱讀