ICC訊 6月19~20日,2024中國光網絡研討會在北京成功舉辦。在會議期間,海思光電先進光電實驗室主任滿江偉博士發表題為“星云光模塊助力智算中心光互聯技術發展”的主題演講,分享智算中心網絡對光互聯的技術需求以及海思光電面向智算中心光互聯的星云系列光模塊產品。
近年來,大模型的爆發性發展帶動了AI智算中心向超大規模集群演進。大規模計算集群中的NPU/GPU高性能互聯成為影響網絡性能的關鍵因素,并且正在經歷著快速迭代演進。不斷加快的產品換代催生光互聯接口的代際升級,面向AI光互聯的光模塊正迎來爆發性增長。
滿江偉博士在分享中指出:運營商的數據中心分布廣泛,涵蓋從城市的核心數據中心到區域的邊緣接入數據中心,部署環境復雜且面臨鹽霧、硫化、水汽等復雜場景挑戰,因此對于光模塊的長期性能和穩定性有較高的要求。IPEC國際光電委員會正在協同全產業鏈伙伴探索電信級光模塊可靠性保證。同時,AI智算中心向大規模集群演進的過程中,由于采用了大規模并行計算,AI計算相比通用計算具有更高的集約度和更大的能耗,因此在大帶寬、低時延、低功耗、高可靠、智能化等多個方面都對光互聯模塊提出了新的挑戰。
海思光電立足AI智算中心的光互聯需求,聯合計算、網絡等領域進行協同創新,推出面向AI智算中心的星云系列光模塊,從五大維度適配AI智算需求,提升計算網絡效率:
-- 大帶寬維度:依托基于VCSEL的多模光芯片和基于TFLN、EML及硅光的單模光芯片,打造400G、800G短距光互聯產品,匹配AI智算中心的互聯需求。持續提升單Lane速率,推進光模塊向更高速率演進
-- 低時延維度:推進系統側、模塊側的協同處理,采用低時延FEC等措施降低端到端時延。此外,針對業界討論熱點之一的LPO方案,持續關注其在標準化、互聯互通等方面的挑戰與進展
-- 低功耗維度:在電/光/系統級等多個領域進行協同優化,充分挖掘技術潛力,構建系統級的功耗優化方案來降低per-bit的功耗
-- 高可靠維度:AI智算網絡的鏈路故障來源于光纖鏈路、連接器、光電轉換單元、系統設備等多個部分。針對AI計算對高可靠光互聯的需求,從系統層面進行統籌考慮,采用光/電聯合設計,提升光模塊長期工作的穩定性和系統的可靠性
-- 智能化維度:引入AI技術提升光模塊和智算網絡的可運維性,通過對光模塊、光鏈路參數的數據檢測分析,對光模塊本體、光電鏈路健康度進行診斷;同時,與設備層面進行聯動,主動預防網絡故障
滿江偉博士最后指出,AI及AI智算網絡正處于前所未有的加速發展階段,這對光互聯既是機會也是挑戰。海思光電打造的星云系列光模塊將繼續適配AI智算網絡對光互聯的關鍵需求,賦能高可用、高可靠、智能化等業務場景,助力AI數據中心的蓬勃發展。