當前位置首頁 > 中國制造 > 企業(yè) >

云知聲引領未來智能交互：山海多模態(tài)大模型開啟AIGC新紀元

中國產業(yè)經濟信息網時間：2024-09-13

近年來,中國AIGC(人工智能生成內容)市場呈現出爆發(fā)式增長態(tài)勢。根據量子位智庫數據,2023年中國AIGC市場規(guī)模已達到約170億元,并預計在未來幾年內持續(xù)保持高速增長,并在商業(yè)化應用方面擁有巨大潛力。

多模態(tài)發(fā)展已成為大模型行業(yè)共識

數據顯示,到2025年之前,中國AIGC市場規(guī)模的增長率預計將維持在25%左右,市場規(guī)模將達到257億元。而自2025年起,隨著底層大模型的逐步對外開放,中間層及應用層將迎來爆發(fā)式增長,帶動AIGC行業(yè)市場規(guī)模的快速增長。年均復合增長率將超過70%,預計到2027年,中國AIGC市場規(guī)模將超過600億元。到2028年,AIGC產業(yè)生態(tài)將更加成熟,并在各行各業(yè)實現商業(yè)化落地應用。至2030年,市場規(guī)模更是有望突破萬億人民幣大關。

在蓬勃發(fā)展的AIGC市場中,多模態(tài)發(fā)展已成為行業(yè)共識。AI模型按照處理的數據類型數量,可以劃分為單模態(tài)和多模態(tài)兩類。相較于只能處理一種類型數據的單模態(tài)模型,多模態(tài)模型能夠處理兩種或兩種以上的數據類型,從而在輸入輸出端展現出明顯優(yōu)勢。不同模態(tài)的輸入數據具有互補性,多元訓練數據輸入有助于通用大模型能力的快速擴展。同時,多模態(tài)數據輸入使用門檻更低,數據損耗更少,能夠大幅提升使用者的應用體驗。而多模態(tài)數據的輸出則省去多模型的整合,更容易實現商業(yè)落地。

云知聲布局多模態(tài)大模型

作為深耕AI領域的獨角獸企業(yè),云知聲早早布局多模態(tài)大模型。

2023年5月,云知聲發(fā)布山海大模型,這是其在AIGC領域交出的第一份答卷。自發(fā)布以來,山海大模型始終保持高速迭代,并在多個權威賽事上屢獲佳績。在SuperCLUE中文大模型基準測評、MedBench中文醫(yī)療大模型評測、CCKS 2023醫(yī)療大模型評測等賽事中,山海大模型展現出全面的通用能力和優(yōu)秀的專業(yè)能力,穩(wěn)居全球大模型第一梯隊。

云知聲深知,推動山海大模型邁進AIGC的關鍵在于其多模態(tài)交互能力的發(fā)展。因此,在不斷提升山海大模型自然語言處理能力的同時,云知聲也在積極發(fā)展其多模態(tài)能力。時隔一年,2024年8月,云知聲推出山海多模態(tài)大模型,它能夠接收文本、音頻、圖像等多種形式作為輸入,并實時生成文本、音頻和圖像的任意組合輸出,帶來實時多模態(tài)擬人交互體驗。

山海多模態(tài)大模型,帶來更智能聲色體驗

在語音交互方面,山海大模型展現出色的實時響應能力,用戶幾乎感知不到延遲,同時支持對話隨時打斷,使得交互過程更加靈活不受阻礙。此外,山海還能通過語音文本判斷用戶情緒,并予以適當的情感反饋,提供貼心的情感支持。

在聲音方面,山海大模型能模仿人類的自然語言特征,還能根據用戶個性化需求自由切換音色,增強對話的生動性和趣味性?；谠浦暤穆曇艨寺〖夹g,山海能夠全面學習用戶音色、風格,實現高保真還原。

在視覺交互方面,山海大模型通過攝像頭“看見”周圍環(huán)境,實現精準識別。同時,結合圖像生成技術,山海能夠根據用戶指令快速創(chuàng)建視覺內容,提供符合個性化需求的定制畫面。

隨著AIGC市場的不斷擴大和技術的不斷進步,云知聲將繼續(xù)深耕多模態(tài)大模型領域,推動山海大模型在更多應用場景中落地,致力于打造一個能夠深入理解世界、與人類進行自然而富有洞察力的交流的智能伙伴,全方位滿足人們工作、社交、娛樂等多樣話需求。

　　轉自：中國網

返回產經網首頁 >>

　　【版權及免責聲明】凡本網所屬版權作品，轉載時須獲得授權并注明來源“中國產業(yè)經濟信息網”，違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊，僅代表作者個人觀點，不代表本網觀點和立場。版權事宜請聯系：010-65363056。

延伸閱讀

熱點視頻

上半年汽車工業(yè)多項經濟指標創(chuàng)新高

熱點新聞

熱點輿情

云知聲引領未來智能交互：山海多模態(tài)大模型開啟AIGC新紀元

熱點視頻

熱點新聞

熱點輿情

微信公眾號