國內(nèi)最新的智能語音技術(shù)成果表明,機器已能以較高的準確率實現(xiàn)語音轉(zhuǎn)化文字、多語種同步翻譯、甚至模仿某個人的聲線講話,以假亂真。
據(jù)新華社25日消息,在23日召開的科大訊飛年度發(fā)布會上,多位嘉賓近3小時的演講交流,全程無速記員,演講內(nèi)容卻能實時轉(zhuǎn)成文字顯示在大屏幕上。在智能車載系統(tǒng)的展示中,面對駕駛員任性地打斷、隨意地插話,車載系統(tǒng)竟通過上下文語境“秒懂”駕駛員意圖,甚至對故意“刁難”的極簡指令,也能迅速聽懂“弦外之音”,導航、聽歌、團票都不在話下。
據(jù)介紹,這些都是基于深度神經(jīng)網(wǎng)絡(luò)的語音識別技術(shù)來實現(xiàn)的。語音識別技術(shù),簡單說就是讓計算機“聽懂”人類的語音,將語音中包含的文字信息提取出來。該項技術(shù)在智能計算機系統(tǒng)中扮演著重要角色,相當于給計算機裝上了“耳朵”,使其實現(xiàn)人機通信和交互。目前語音識別準確率可達到97%。
“隨著萬物互聯(lián)時代到來,以語音為主、鍵盤觸摸為輔的人機交互正逐漸成為剛需。未來5到10年,人工智能會像水和電一樣成為我們生活的必需品,深刻改變我們的世界?!笨拼笥嶏w董事長劉慶峰說。
此外,記者在現(xiàn)場用手機試用科大訊飛開發(fā)的語音合成軟件,發(fā)現(xiàn)語音合成功能不僅能將文字信息轉(zhuǎn)化為可聽的聲音信息,還能將某個人的聲線特征收入語音庫中,然后用很短的時間將文本用被模仿者的聲線特點讀出來,確有以假亂真之效。未來,人們的聲音也可能存在被“盜”用。目前,中國在智能語音技術(shù)上已經(jīng)實現(xiàn)了5到8米的遠場識別、多輪交互對話、免喚醒詞交流、交流隨時打斷等多項突破,人機交互越來越流暢自然。
如今,以智能語音技術(shù)為主的人工智能已在手機、教育、家具、汽車、醫(yī)療、服務機器人等多個領(lǐng)域顯示出巨大的應用潛力。中國移動通信集團公司副總裁李正茂表示,基于人工智能技術(shù)的機器人很可能成為繼手機之后下一個超過全球人口總數(shù)的電器產(chǎn)品,未來機器人市場規(guī)??赡芡黄瓢賰|。
來源:中國證券網(wǎng)
轉(zhuǎn)自:
【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀