天津超算中心發(fā)布“天河天元大模型”


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2023-05-30





  5月19日,在第七屆世界智能大會上,由國家超級計算天津中心“天河E級智能計算開放創(chuàng)新平臺”訓(xùn)練研發(fā)的“天河天元大模型”正式發(fā)布。該模型是立足國產(chǎn)天河超級算力和智能算力,匯集構(gòu)建中文大數(shù)據(jù)集,由平臺自主訓(xùn)練研發(fā)的大型模型。


  生成式通用智能是重大變革性突破。以ChatGPT為代表的生成式智能開啟了人工智能發(fā)展新階段。與單一判別式智能工具不同,生成式智能是文本生產(chǎn)、數(shù)據(jù)分析、代碼編寫、圖像生成等跨媒體多模態(tài)領(lǐng)域的通用智能工具,將滲入到生產(chǎn)、教育、工作生活等場景,并對人類生產(chǎn)方式、思想認知、社會治理等帶來變革性影響,將重塑人與智能機器生產(chǎn)關(guān)系。


  訓(xùn)練模型以數(shù)據(jù)和算力為基礎(chǔ)。谷歌BERT、OpenAI的GPT和百度文心大模型其參數(shù)規(guī)模已提升至千億、萬億,并隨之帶來巨大的數(shù)據(jù)量級需求。


  天津依托天河占據(jù)了全國超過20%的超級計算算力資源,成為算力賦能科技創(chuàng)新和產(chǎn)業(yè)發(fā)展重鎮(zhèn)。天河E級智能計算開放創(chuàng)新平臺將帶來突破百億億次的多精度融合超級計算算力。


  天津超算中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓(xùn)練數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù),以及專業(yè)領(lǐng)域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集,訓(xùn)練打造了自主研發(fā)的中文語言大模型——天河天元大模型。同時啟動面向醫(yī)療、工業(yè)、法律等領(lǐng)域?qū)I(yè)模型深度訓(xùn)練,模型將作為產(chǎn)業(yè)智能化升級基座,用專業(yè)數(shù)據(jù)集,打造更貼合行業(yè)領(lǐng)域的智能化高水平“專家”。


  未來,以生成式AI為基座的產(chǎn)業(yè)鏈,將成為智能化升級過程中可大規(guī)模復(fù)用的基礎(chǔ)設(shè)施。在大模型通用性、泛化性以及降低人工智能應(yīng)用門檻的優(yōu)勢推動下,人工智能也將會加快落地,形成新的機遇。(經(jīng)濟日報記者 商瑞)


  轉(zhuǎn)自:經(jīng)濟日報客戶端

  【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964