來源:華爾街見聞
AI領域又一重大突破?媒體稱,英特爾(30.54, -0.20, -0.65%)推出首款OCI芯片組,能提高AI基礎設施的數(shù)據(jù)傳輸速率,并減少延遲和功耗,這對需要高速數(shù)據(jù)傳輸?shù)腁I基建和應用至關重要。
美東時間6月26日,在2024年的光纖通信會議(OFC)上,英特爾的集成光子解決方案(IPS)小組展示了業(yè)界最先進的、也是首次完全集成的光計算互連(OCI)芯片組,該芯片組與英特爾CPU共同封裝并運行實時數(shù)據(jù)。
英特爾的OCI芯片組通過在數(shù)據(jù)中心和高性能計算 (HPC) 應用的新興AI基礎設施中實現(xiàn)共同封裝的光輸入/輸出 (I/O),代表了高帶寬互連的一次飛躍。英特爾稱,我們在融合光電科技到高速數(shù)據(jù)傳輸方面實現(xiàn)一個革命性的里程碑。
功能方面,這款首款OCI芯片支持64個獨立通道,每個通道能夠以32千兆位/秒 (Gbps)的速率傳輸數(shù)據(jù),并在長達100米的光纖上高效傳輸數(shù)據(jù),有望滿足AI基礎設施對更高帶寬、更低功耗和更長傳輸距離日益增長的需求。它增強了集群中CPU與GPU之間的連接,并支持創(chuàng)新的計算架構(gòu),如一致性內(nèi)存擴展和資源解耦。
新一代光學I/O技術推動了計算平臺的革新,以適應日益增長的AI工作負載
隨著AI技術的飛速發(fā)展,自動駕駛、高級數(shù)據(jù)分析和虛擬助手等應用在全球范圍內(nèi)日益普及,對計算資源的需求急劇增加。特別是大型語言模型如GPT,以及生成式AI技術的快速發(fā)展,極大地推動了AI技術的應用。然而,這些先進的AI模型需要處理和生成的數(shù)據(jù)量巨大,對計算資源和數(shù)據(jù)傳輸提出了極高的要求。
隨著機器學習模型的規(guī)模不斷擴大,它們在AI加速工作中的作用也變得越來越復雜,需要極高的計算能力和數(shù)據(jù)處理能力才能有效運行。這種對高性能計算平臺的需求正在推動輸入/輸出(I/O)帶寬的指數(shù)級增長和(4.7, 0.10, 2.17%)數(shù)據(jù)傳輸距離的延伸。
為了應對這一挑戰(zhàn),數(shù)據(jù)中心正在向更大的處理單元集群,如CPU、GPU和IPU的使用,以及更高效的資源利用架構(gòu),如xPU解耦和內(nèi)存池化方向發(fā)展。這些技術的實施將提高處理效率,降低系統(tǒng)延遲,并優(yōu)化資源配置,從而支持更廣泛的AI計算和應用。
盡管傳統(tǒng)的電子I/O系統(tǒng)在傳輸大量數(shù)據(jù)時表現(xiàn)出高帶寬密度和低功耗的優(yōu)點,但其最大的弱點是傳輸距離短,通常僅限于一米內(nèi)。這嚴重限制了數(shù)據(jù)中心內(nèi)部的設備布局,使得組件之間的連接受到嚴格的空間限制。
為了突破這一限制,數(shù)據(jù)中心和早期AI集群開始采用可插拔光學模塊技術,這種技術能夠提供比電子I/O更長的傳輸距離。然而,隨著AI應用對資源的不斷增加,光學模塊在成本和能耗方面的壓力也隨之增大。
為了應對這些挑戰(zhàn),新一代光學I/O技術應運而生。這種技術將光學I/O與處理器(如CPU、GPU或IPU等,統(tǒng)稱為xPU)共封裝,不僅大幅提高了帶寬,還優(yōu)化了芯片內(nèi)部的光和電信號傳輸,顯著降低了能量消耗,還大幅減少了數(shù)據(jù)傳輸過程中的延遲,對于需要快速響應的AI應用來說至關重要。
更令人興奮的是,這項技術支持的傳輸距離遠超以往,為數(shù)據(jù)中心的設計提供了更大的靈活性,使得系統(tǒng)能夠適應更廣泛的擴展需求。光學I/O技術的推廣不僅解決了數(shù)據(jù)傳輸?shù)耐袋c,也為AI和機器學習的未來發(fā)展鋪平了道路。
打個比方,傳統(tǒng)的電子I/O連接,類似于舊式馬車,在短距離傳輸中效率較高,但面對大量數(shù)據(jù)的長距離傳輸需求時,卻顯得力不從心。而英特爾的OCI芯片等光學I/O技術,如同現(xiàn)代的汽車和卡車,不僅能在更長的距離上傳輸更多的數(shù)據(jù),而且保持數(shù)據(jù)的完整性,大大超越了傳統(tǒng)電子I/O的性能。
隨著AI和ML模型需求的不斷擴大,光學I/O憑借其卓越的傳輸能力和高效能源利用,成為推動未來AI技術發(fā)展的關鍵力量。就像汽車和卡車滿足了現(xiàn)代社會對快速、大規(guī)模物流的需求一樣,光學I/O使得數(shù)據(jù)能夠更快、更高效地在更長的距離上傳輸,這對于擴展AI基礎設施至關重要。
英特爾在硅光子學領域處于領導地位
憑借超過25年的深厚研究基礎,英特爾實驗室在集成光子學領域取得了開創(chuàng)性的成就。英特爾不僅是首家成功開發(fā)并大規(guī)模生產(chǎn)硅光子連接產(chǎn)品的企業(yè),更是以其卓越的產(chǎn)品可靠性,贏得了全球主要云服務提供商的信賴。
英特爾的核心競爭力在于其獨特的混合激光器晶圓上技術和直接集成工藝,這些技術不僅提高了產(chǎn)品的可靠性,還降低了成本。這種獨特的方法使得英特爾能夠在保持高效率的同時,提供卓越的性能。到目前為止,英特爾的強大生產(chǎn)平臺已經(jīng)出貨超過800萬片集成電路芯片,這些芯片集成了超過3200萬個芯片級激光器。其激光器的故障率極低(故障率小于0.1),這一指標在業(yè)界廣泛認可,表明故障率極低。
這些芯片被封裝在可插拔的收發(fā)器模塊中,并在大型數(shù)據(jù)中心網(wǎng)絡中得到部署,服務于多家大型云服務提供商,用于100Gbps、200Gbps和400Gbps的應用。目前,英特爾還在開發(fā)下一代200Gbps每通道的芯片,以支持即將到來的800Gbps和1.6Tbps的應用。
在制造工藝上,英特爾引入了全新的硅光子制造工藝節(jié)點,這一工藝不僅提升了設備性能,還實現(xiàn)了更高的集成度和更佳的耦合效率,同時顯著降低了成本。英特爾在芯片激光器和SOA性能、成本控制以及能效優(yōu)化方面不斷取得突破,芯片面積減少了超過40%,能耗降低了超過15%,進一步鞏固了其在硅光子技術領域的領先地位。
英特爾目前的OCI芯片模塊尚處于原型階段。展望未來,英特爾正在與特定客戶合作,將OCI與他們的系統(tǒng)級芯片(SoCs)一起封裝,開發(fā)一種創(chuàng)新的光學輸入/輸出解決方案。