中國電信基于800G WDM現網完成業(yè)界首例千卡分布式無損智算網驗證


中國產業(yè)經濟信息網   時間:2024-09-04





  近日,在中國電信集團公司統(tǒng)一組織下,中國電信研究院、北京電信、天翼云共同在中國電信現網基于800G C+L技術,為1024卡規(guī)模的分布式集群提供大容量帶寬,實現120公里千億參數大模型分布式訓練,性能達到集中訓練的95%以上,重點驗證了大帶寬、高可靠和高效率的光傳輸網絡可為智算互聯(lián)構建堅實底座。


  當前,隨著智算卡數達到千卡、萬卡,所需帶寬往往高達百T比特級、超P比特級。因此,光傳輸系統(tǒng)的大帶寬、高可靠與高效率的特點是保證分布式訓練高算效的關鍵。針對數據傳輸的大帶寬問題,采用高階調制格式的單波長800G技術以提高頻譜效率,配合當前業(yè)界熱點的“C+L”波段技術實現超大傳輸帶寬,在中國電信天津武清與潤澤機房之間采用華為公司傳輸設備,通過多次環(huán)回構建了大帶寬互聯(lián)的智算驗證網,距離達到120公里;針對數據傳輸的高可靠問題,完成了鏈路誤碼、波長故障、光纖故障等異常測試試驗,結果表明,一個800G業(yè)務波中斷會導致超40%的算效降低,而百毫秒級以上光纖故障會導致算效大幅下降甚至訓練中斷,采用WSON重路由恢復技術,此次在兩點間將重路由恢復時間控制在50ms以內,可保證分布式智算業(yè)務的高可靠互聯(lián),最大限度釋放算效;針對傳輸鏈路的高效率問題,中國電信提出分鐘級波長動態(tài)拆建解決方案來實現算與網的協(xié)同分時復用,有效提升網絡資源利用率。此次驗證為跨地域、跨層級、跨主體高可靠的算力協(xié)同調度奠定基礎,標志著中國電信“云網融合”工作再上新臺階。


  未來,中國電信將不斷創(chuàng)新,繼續(xù)踐行“以網強算”的技術路線,通過大帶寬、高可靠和高效率的光傳輸網絡建設打造智算互聯(lián)光層底座,加快推進云網融合一體化數字基礎設施建設,走出一條具有中國電信特色的新型智算基礎設施發(fā)展道路,賦能千行百業(yè)智能化升級。(翼研)


  轉自:人民郵電報

  【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業(yè)經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯(lián)系:010-65363056。

延伸閱讀

?

版權所有:中國產業(yè)經濟信息網京ICP備11041399號-2京公網安備11010502035964