飛象原創(chuàng)(魏德齡/文)擁抱AI,將現(xiàn)有業(yè)務(wù)與新技術(shù)相融合,是如今正在被眾多企業(yè)所關(guān)注的話題。但如個(gè)人用戶在部署本地AI時(shí),可能會(huì)考慮內(nèi)存與算力如何與相關(guān)大語言模型所匹配的問題類似,企業(yè)在自身能力基礎(chǔ)上需要做出更多考量,如何控制能源的消耗,獲得最優(yōu)的投入產(chǎn)出,才能免除部署疑慮,在軟硬件的更新?lián)Q代中實(shí)現(xiàn)AI融合。
近日,英特爾擴(kuò)展了至強(qiáng)6產(chǎn)品組合,帶來面向通用服務(wù)器負(fù)載的至強(qiáng)6700/6500P系列(Granite Rapids-SP)和面向網(wǎng)絡(luò)和邊緣應(yīng)用的至強(qiáng)6 SoC(Granite Rapids-D)。兩款產(chǎn)品均針對(duì)AI需求提供了專門的技術(shù)支持。其中至強(qiáng)6700/6500P系列中首次支持的MRDIMM技術(shù),讓CPU實(shí)現(xiàn)了對(duì)AI更好的支持。
首款支持MRDIMM的平臺(tái)
至強(qiáng)6700/6500P系列的目標(biāo)是更好地服務(wù)傳統(tǒng)企業(yè)各種不同的廣泛應(yīng)用,包括最新的AI應(yīng)用、傳統(tǒng)的數(shù)據(jù)庫或者是邊緣、存儲(chǔ)或不同的傳統(tǒng)計(jì)算。
在AI工作負(fù)載需求日益增強(qiáng)的情況下,更快的內(nèi)存帶寬可以讓CPU更好地支持AI。原因在于部分工作負(fù)載,如推薦系統(tǒng)中的某些任務(wù),仍然依賴CPU處理且對(duì)內(nèi)存帶寬極為敏感。
英特爾在多年以前便開始與眾多廠商進(jìn)行MRDIMM技術(shù)的推進(jìn)。在此次發(fā)布的至強(qiáng)6產(chǎn)品中,相比內(nèi)存速度在4800-5600MT/s的第五代至強(qiáng),至強(qiáng)6的速度已經(jīng)提升到了DDR5 6400MT/s。MRDIMM更可以把這個(gè)速率大幅提升到8800MT/s。相比于現(xiàn)已在市面上部署的數(shù)據(jù)中心服務(wù)器,提升達(dá)到50%以上。
MRDIMM可以在第一時(shí)間大幅度提升內(nèi)存帶寬,能夠?yàn)橹行∧P屯评砣蝿?wù)提供更好的性價(jià)比。MRDIMM與至強(qiáng)6的結(jié)合,以及與其他加速卡的搭配,將顯著提升端到端業(yè)務(wù)的性能。
例如對(duì)于小規(guī)模的大語言模型而言,其推理過程不僅在生成首個(gè)Token時(shí)需要進(jìn)行密集的計(jì)算,更重要的是,在后續(xù)的大多數(shù)Token推理中,對(duì)內(nèi)存帶寬的需求非常高。因此,至強(qiáng)6處理器與MRDIMM技術(shù)的結(jié)合可以帶來更佳表現(xiàn)。
“我們的最新超級(jí)計(jì)算機(jī)將配備英特爾至強(qiáng)6處理器,采用P核,這是最新的處理器技術(shù),并結(jié)合高帶寬MRDIMM內(nèi)存。它將為用戶提供顯著加速解決特定受內(nèi)存限制任務(wù)的能力,這對(duì)于科學(xué)研究至關(guān)重要!盜T4Innovations超級(jí)計(jì)算服務(wù)總監(jiān)Jansik表示。
同時(shí),至強(qiáng)6平臺(tái)上還完整地支持了業(yè)界標(biāo)準(zhǔn)CXL 2.0。其中一個(gè)突出的應(yīng)用場景就是如何通過CXL2.0擴(kuò)展內(nèi)存,來以更高的性價(jià)比去拓展服務(wù)器的內(nèi)存空間,進(jìn)而滿足包括AI在內(nèi)對(duì)于內(nèi)存總量敏感的應(yīng)用場景需求。
打消部署后顧之憂
英特爾至強(qiáng)6700/6500性能核處理器能夠提供出色的性能與能效平衡。與上一代產(chǎn)品相比,至強(qiáng)6處理器在廣泛的企業(yè)工作負(fù)載中實(shí)現(xiàn)了平均1.4倍的性能提升。作為AI系統(tǒng)的機(jī)頭節(jié)點(diǎn)CPU,至強(qiáng)6可與GPU搭配,為客戶提供優(yōu)選組合。
此外,它以更少的核心數(shù)量,提供高達(dá)1.5倍的AI推理性能提升。能夠在如大數(shù)據(jù)、科學(xué)計(jì)算、AI、網(wǎng)絡(luò)等應(yīng)用中,以在同樣能耗的情況下,帶來更加顯著的性能提升。以5年使用周期計(jì),平均可以實(shí)現(xiàn)以一臺(tái)新的服務(wù)器替代五臺(tái)舊服務(wù)器5,在某些用例中該比例可達(dá)10:1,從而節(jié)省高達(dá)68%的TCO。
得益于至強(qiáng)內(nèi)置的AMX加速引擎,在同等核心數(shù)下,至強(qiáng)在矢量數(shù)據(jù)庫離線構(gòu)建索引表的過程中,性能甚至可以高過友商30%。另在圖片分類這樣的傳統(tǒng)AI領(lǐng)域最高可達(dá)50%以上的性能提升。
英特爾還關(guān)注到了由AI部署所產(chǎn)生的AI隱憂,針對(duì)進(jìn)入到AI時(shí)代后異構(gòu)系統(tǒng)的普及,業(yè)界希望英特爾可以和其他加速卡生產(chǎn)商一起聯(lián)合構(gòu)建一個(gè)不僅包含CPU,同時(shí)也包含GPU的硬件防護(hù)的體系。至強(qiáng)6中的TDX Connect技術(shù)構(gòu)建了一個(gè)CPU與GPU整體的防護(hù)網(wǎng),無論是放在CPU上的數(shù)據(jù)抑或是業(yè)務(wù)入口,又或者運(yùn)行在GPU上的模型參數(shù)或是模型數(shù)據(jù),都能得到硬件防護(hù)。這也意味著,即便是一臺(tái)云主機(jī),云服務(wù)提供商也無法獲取用戶的任何數(shù)據(jù)。
“Intel TDX Connect代表了提升機(jī)密計(jì)算的一大里程碑,增強(qiáng)了性能和可擴(kuò)展性。它使現(xiàn)有和全新的工作負(fù)載能夠受益于機(jī)密計(jì)算的隱私保障,而不會(huì)在成本或性能上妥協(xié)!蔽④汚zure產(chǎn)品主管Vikas Bhatia表示。
顯然,在云端至強(qiáng)6700/6500P系列解除了企業(yè)在面對(duì)各類任務(wù)流時(shí)的掣肘,在與AI業(yè)務(wù)相關(guān)的任務(wù)中,無論是如圖像識(shí)別、語言處理、推薦系統(tǒng)等這類經(jīng)典AI模型,還是中小參數(shù)量的大語言模型,都能在保證安全的情況下,以更小的能耗,帶來更優(yōu)的性能表現(xiàn)。
借助融合降低TCO的全新SoC
在邊緣側(cè),以電信運(yùn)營商為代表的廠商同樣正在思考AI融合的問題,將傳統(tǒng)的網(wǎng)絡(luò)在連接功能基礎(chǔ)上引入智能與算力。以AI應(yīng)用為例,邊緣服務(wù)器可應(yīng)用于智能工廠,助力礦山開采作業(yè),亦能用于智能攝像頭相關(guān)場景。此類設(shè)備會(huì)集成多種網(wǎng)絡(luò)功能,如SD-WAN,同時(shí)整合安全功能。更為重要的是,它可以將各類AI應(yīng)用集成于一體,例如智能監(jiān)控與安全監(jiān)控應(yīng)用。
本次同期推出的至強(qiáng)6處理器便是一款專為網(wǎng)絡(luò)和邊緣應(yīng)用設(shè)計(jì)了一款全新SoC。該產(chǎn)品是專門面向運(yùn)營商,針對(duì)網(wǎng)絡(luò)和邊緣應(yīng)用而設(shè)計(jì)的。對(duì)多樣化的功能特性進(jìn)行了高度集成,整合了英特爾至強(qiáng)6性能核處理器的特性,將核心提升至72個(gè),并整合多種加速器,例如面向vRAN的vRAN boost技術(shù)、面向媒體的英特爾媒體轉(zhuǎn)碼加速器,以及面向AI加速的英特爾高級(jí)矩陣擴(kuò)展。
作為一顆系統(tǒng)芯片,至強(qiáng)6處理器實(shí)現(xiàn)了功耗與性能的平衡。例如在與諾基亞的合作中,提升了70%的性能功耗比,幫助運(yùn)營商提升了整體密度,帶來高達(dá)2.4倍的無線接入網(wǎng)工作負(fù)載容量提升;另外在AI領(lǐng)域,該產(chǎn)品內(nèi)置新的英特爾高級(jí)矩陣擴(kuò)展英特爾AMX,讓單核AI RAN性能較上一代提升3.2倍;在網(wǎng)絡(luò)安全領(lǐng)域,該產(chǎn)品實(shí)現(xiàn)了Webroot CSI上傳模型的推理速度大幅提升,相比于英特爾至強(qiáng)D-2899NT處理器,提升最高可達(dá)4.3倍。
至強(qiáng)6處理器還是首款內(nèi)置媒體轉(zhuǎn)碼加速器的服務(wù)器SoC。得益于此在編解碼任務(wù)時(shí)可實(shí)現(xiàn)較大性能功耗比的提升。相較于英特爾至強(qiáng)6538N處理器,每瓦性能提升達(dá)到了14倍。在Synamedia已經(jīng)采用了至強(qiáng)6系統(tǒng)級(jí)芯片,實(shí)現(xiàn)了編解碼的每瓦性能提升。另外還能幫助傳統(tǒng)VDI領(lǐng)域,提升媒體的處理效率,減少總體擁有成本。
“業(yè)界常常討論智算網(wǎng)融合,原因是希望可以有一個(gè)基礎(chǔ)建設(shè)能用到不同場景中,讓你的‘投資’不會(huì)被鎖到某一個(gè)領(lǐng)域當(dāng)中。所以為了經(jīng)濟(jì)性,我們的看法是選一個(gè)可以支持各種應(yīng)用的平臺(tái),不管是網(wǎng)絡(luò)、AI、網(wǎng)絡(luò)邊緣還是控制的應(yīng)用!庇⑻貭栔袊W(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理阮伯超表示。
英特爾同樣以這一原則來設(shè)計(jì)產(chǎn)品,無論是選擇AI應(yīng)用、網(wǎng)絡(luò)部署還是邊緣控制,英特爾的產(chǎn)品均基于同一開發(fā)平臺(tái)實(shí)現(xiàn)。通過軟件層面的差異化配置,可以滿足不同應(yīng)用場景需求,無需分別為網(wǎng)絡(luò)、AI搭建獨(dú)立平臺(tái)。借助這一融合平臺(tái),能夠最大程度降低總體擁有成本。
目前至強(qiáng)6能效核處理器,已經(jīng)用在很多的5G網(wǎng)絡(luò)中,通過與業(yè)界伙伴的合作,其性能得到了充分發(fā)揮。經(jīng)5G核心網(wǎng)解決方案合作伙伴獨(dú)立驗(yàn)證,該處理器實(shí)現(xiàn)了3.2倍的性能提升、3.8倍的每瓦性能提升。此外,配合在MWC24上推出的英特爾基礎(chǔ)設(shè)施電源管理器軟件,運(yùn)行時(shí)功耗更可降低60%。
至強(qiáng)6新品正在以最優(yōu)TCO釋放AI潛能,讓企業(yè)能夠從云到邊無憂部署,不僅助力高效應(yīng)對(duì)AI計(jì)算挑戰(zhàn),還在云端、邊緣等多場景下提供更優(yōu)的能效表現(xiàn),讓AI融合之路更輕松、更經(jīng)濟(jì)、更具未來價(jià)值。