全球首個多模態(tài)地理科學大模型發(fā)布


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2024-09-24





  多模態(tài)地理科學大模型“坤元”(Sigma Geography)19日正式發(fā)布。這是全球首個多模態(tài)地理科學大模型,由中國科學院地理科學與資源研究所聯(lián)合中國科學院青藏高原研究所、中國科學院自動化研究所等單位共同研發(fā)。


  “坤元”首席科學家、中國科學院地理科學與資源研究所研究員蘇奮振介紹,該模型是專注于地理科學的專業(yè)語言大模型,具備處理地理科學相關問題的專業(yè)能力,目前完成了地理學全譜系高質(zhì)量語料庫構建、地理科學語言大模型構建、地理科學研究智導平臺研發(fā)等工作,可實現(xiàn)地理專業(yè)問題解答、地理學文獻智能分析、地理數(shù)據(jù)資源查詢、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能。


  據(jù)了解,“坤元”具備“懂地理”“精配圖”“知人心”“智生圖”等特點。


  懂地理,是指“坤元”建立了涵蓋4大類、16小類的地理全學科語料庫,提供320億詞元供大模型自監(jiān)督學習,并制作了4萬余條高質(zhì)量地理學指令進行模型微調(diào)。相比通用語言大模型,“坤元”更熟悉地理學的語言模式、專業(yè)術語和領域知識,在地理學基準測試集上的準確性提升了31.3%。


  精配圖,是指“坤元”可以根據(jù)生成的文字答案檢索不同地理要素,并匹配地理景觀照片、專題地圖或示意圖表呈現(xiàn)給提問者。


  知人心,是指“坤元”能充分考慮地理知識愛好者、地理學專業(yè)學生以及科研人員的地理科學知識體系認知和表達差異,以圖文共現(xiàn)的方式給出適配用戶知識結(jié)構的地理學專業(yè)問題解答。


  智生圖,則是指團隊基于“坤元”開發(fā)的科研助手,可以根據(jù)用戶指令完成概念理解、數(shù)據(jù)獲取、信息分析、制圖綜合等流程,最終生成用戶需要的專業(yè)地理圖表。


  “‘坤元’目前主要支持科研用戶,未來將逐步面向公眾開放。”蘇奮振表示,“坤元”將賦能地理科學研究、加速重大地理科學發(fā)現(xiàn)。未來,研發(fā)團隊將推進地圖大模型及地理推理機研發(fā),有望讓地理科學語言大模型讀懂地圖;將打造地理科研協(xié)作大平臺,以期讓每個科學家和科研團隊都可以擁有專屬的地理大模型,能夠與數(shù)百萬科學家通過共享數(shù)據(jù)、模型、研究思路等方式協(xié)同工作。(記者齊芳)


  轉(zhuǎn)自:光明日報

  【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉(zhuǎn)載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65363056。

延伸閱讀

?

版權所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964