在教室,老師通過遙控器和智能黑板直接對話;在家里,空調(diào)、電視機等家電早已實現(xiàn)語音控制;駕車行駛在路上,一句指令就能操控汽車;會議室里,多人發(fā)言都能立刻被清晰錄音并轉(zhuǎn)寫成文字、生成會議紀(jì)要……近年來,智能語音正潤物細無聲地改變著人們的生活,也創(chuàng)造了巨大的市場價值。
據(jù)國際數(shù)據(jù)公司IDC分析,預(yù)計到2030年,全球智能語音服務(wù)市場規(guī)模將達731.6億美元,復(fù)合增長率27%。如此龐大的市場,中國如何實現(xiàn)技術(shù)突破?以科大訊飛為代表的中國科技企業(yè)給出答案:自主創(chuàng)新。
20世紀(jì)90年代,中國的智能語音技術(shù)和語音產(chǎn)業(yè)還是外國人的天下。據(jù)了解,科大訊飛創(chuàng)始人劉慶峰當(dāng)時還是中國科學(xué)技術(shù)大學(xué)的學(xué)生,在導(dǎo)師王仁華的支持下,他和幾位同學(xué)創(chuàng)立了科大訊飛。
經(jīng)過多年研究和實踐,科大訊飛不僅將中文語音技術(shù)做到領(lǐng)先,也將多語種技術(shù)做到全球領(lǐng)先:語音識別的準(zhǔn)確率達到98%,多人會議場景的說話人分離和識別的準(zhǔn)確率達到95%。2006年至2019年,連續(xù)十四年榮獲國際語音合成大賽冠軍;2016年至2023年,連續(xù)4屆獲得國際多通道語音分離和識別比賽CHiME冠軍;2021年,科大訊飛在美國國家標(biāo)準(zhǔn)與技術(shù)研究院NIST發(fā)起的國際低資源多語種語音識別競賽OpenASR中,獲得全部受限賽道的15個語種冠軍及7個語種非受限賽道冠軍;2021—2023年,連續(xù)三年獲得國際語音翻譯比賽IWSLT冠軍……
如今,在中國智能語音市場,科大訊飛的市場占有率多年保持第一。不止如此,科大訊飛還取得了多項重要標(biāo)志性成果,逐漸構(gòu)建起獨立的語音自主知識產(chǎn)權(quán)技術(shù)體系。
今年1月30日,科大訊飛發(fā)布基于首個全國產(chǎn)算力訓(xùn)練的訊飛星火V3.5,正式發(fā)布星火語音大模型,首批37個主流語種效果超過OpenAI Whisper V3。
4月26日,訊飛星火大模型V3.5再次更新,發(fā)布業(yè)界首個支持長文本、長圖文以及長語音的大模型產(chǎn)品。其長語音功能可以實現(xiàn)會議錄音、學(xué)習(xí)視頻等的一鍵研讀,實現(xiàn)音視頻場景的高效知識獲取。新版大模型將科大訊飛國際領(lǐng)先的語音識別和翻譯技術(shù)結(jié)合起來,讓英文資料也能像純文字內(nèi)容一樣進行快速獲取和學(xué)習(xí)。
如今,一個自主可控的多語種智能語音技術(shù)及全球產(chǎn)業(yè)生態(tài)正在構(gòu)建??拼笥嶏w的技術(shù)算法全部自研,目前已建成5個國產(chǎn)化集群,語音合成、識別、翻譯、交互等國產(chǎn)化能力日服務(wù)8.73億次。2023年,訊飛與華為聯(lián)合攻關(guān)大模型國產(chǎn)化算力底座核心難題,建設(shè)首個全國產(chǎn)算力平臺“飛星一號”,填補了國產(chǎn)超大模型訓(xùn)練平臺空白。
科大訊飛董事長劉慶峰表示:“我們應(yīng)正視差距,聚焦自主創(chuàng)新的底座大模型‘主戰(zhàn)場’,聚焦資源加快追趕,同時系統(tǒng)性構(gòu)建通用人工智能生態(tài)和應(yīng)用,打造綜合優(yōu)勢?!保S一鶴)
轉(zhuǎn)自:經(jīng)濟參考網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀