飛象網(wǎng)訊(魏德齡/文)只要留心一下身邊,就能發(fā)現(xiàn)AI的無處不在。走進商場中的咖啡面包店,店長的小電腦里不時便會收到AI做出的對于補貨、清潔的提示。走進工廠生產(chǎn)線中的質(zhì)檢環(huán)節(jié),AI正在通過一雙慧眼對于商品是否存在瑕疵進行掃描。
邊緣AI如同一名剛剛學會做應(yīng)用題的小學生,開始在不同的工作崗位上,依據(jù)自身的題庫,對一道道問題給出自己的解。然而,也如同每個人從小學到大學的歷程,邊緣AI也正在經(jīng)歷著成長的煩惱。
邊緣AI成長的煩惱
例如開篇提到的工廠生產(chǎn)線質(zhì)檢案例就面臨著訓練樣本不足的問題。在做產(chǎn)品質(zhì)量檢測過程中,最有效的樣本正是帶有缺陷的樣本,但這類樣本在產(chǎn)線上出現(xiàn)的概率卻很小。如何在較少樣本的情況下實現(xiàn)有效訓練,得到有效的模型更新,正是當下面臨的挑戰(zhàn)之一。
數(shù)據(jù)保護在近期更是被很多人所關(guān)注,如何在保護隱私的情況下利用如聯(lián)邦學習這類新技術(shù)實現(xiàn)數(shù)據(jù)融合,再利用融合的數(shù)據(jù)實現(xiàn)模型的進一步訓練同樣是需要解決的問題。又比如當數(shù)據(jù)處在運行狀態(tài),暫時被存儲在內(nèi)存中時,如何實現(xiàn)保護,使其與其他應(yīng)用之間有一個安全邊界,也同樣是需要關(guān)注的問題。
在汽車領(lǐng)域,自動駕駛對于模型的即時更新訴求正在愈發(fā)強烈。原因就在于汽車廠商此前利用大數(shù)據(jù)訓練的模型與實際駕駛時所面對的路況存在差異,造成模型泛化能力有限。最有效的解決方法就是要讓邊緣AI對于模型擁有二次修正能力,可以不斷重新訓練。
“以自動駕駛為例,它所代表的正是邊緣人工智能發(fā)展的下一個趨勢——邊緣訓練。”英特爾中國區(qū)網(wǎng)絡(luò)與邊緣事業(yè)部首席技術(shù)官、英特爾高級首席 AI 工程師張宇博士在近期2023中國國際服務(wù)貿(mào)易交易會·中國智能產(chǎn)業(yè)論壇主題演講中表示。他認為邊緣AI有三個發(fā)展階段:邊緣推理、邊緣訓練、邊緣AutoML。
成長的三階段
邊緣AI的當下正處于推理向訓練邁進的階段。張宇博士開玩笑地表示稱:“當下的人工智能一半是人工,一半是智能!
原因在于如今的人工智能,無論是在邊緣側(cè)還是數(shù)據(jù)中心,人在人工智能中都扮演了一個非常重要的角色。盡管運用了極大的算力與數(shù)據(jù)去訓練一個網(wǎng)絡(luò)模型,但是模型結(jié)構(gòu)需要人為進行預(yù)先設(shè)定。
第二階段邊緣訓練也往往稱之為增量訓練,即邊緣AI在已有訓練集的基礎(chǔ)上,能夠通過新增樣本集實現(xiàn)增量訓練。如同人類通過不同階段學校的學習,以及大腦的成長,將不僅僅只是根據(jù)固有題庫來做題,還開始具備了舉一反三的能力,能夠在實踐的過程中,來實現(xiàn)能力提升。
當下很多AI應(yīng)用,實際上都處在開放的狀態(tài),而非閉環(huán),也就是說在訓練完模型以后用于推理,推理的結(jié)果并不能馬上就進行反饋,對模型進行二次更新。
這就意味著邊緣AI的最終目標便是實現(xiàn)AutoML,該階段下網(wǎng)絡(luò)模型能夠感知人的意圖,選取適宜的樣本集訓練模型,將訓練結(jié)果推送到訓練階段進行相應(yīng)操作。如同進入大學時代,學生將開始強調(diào)具備自主學習能力,為后續(xù)一生的探索打下重要基礎(chǔ),可以自主選擇課題,進行資料查找,并撰寫論文。
“如果把攀登高峰比喻為人工智能不同階段的話,實現(xiàn)邊緣推理只是意味著站在山腳,能實現(xiàn)邊緣訓練只是到達半山腰,站到山頂是真正實現(xiàn)AutoML的時刻!睆堄畈┦窟@樣形容。
如同攀登一座高峰,或許汽車領(lǐng)域目前展現(xiàn)出的需求似乎是走出一段山谷前所看到的鞍部曙光。技術(shù)的發(fā)展也正在給出邊緣AI演進的暗示,張宇博士認為共有三個關(guān)鍵要素,將推動AI的成長。
助推“快樂”成長
三個重要因素分別是:算力、數(shù)據(jù)、人工智能技術(shù)。算力將能夠支撐越來越復雜的網(wǎng)絡(luò)模型,數(shù)據(jù)讓模型能夠得到一個可以使用的訓練結(jié)果,包括人工智能理論在的關(guān)鍵技術(shù)則起到了底層支撐引導的作用。
“我覺得這三個因素應(yīng)該是相輔相成、缺一不可的,尤其是目標達到第三個階段!睆堄畈┦吭诮邮懿稍L時表示。
盡管目前人工智能還主要依賴于1990年人工智能高潮時便使用的卷積運算原理。但在算力和數(shù)據(jù)上已經(jīng)近年來突破不斷,助推了人工智能的發(fā)展。
例如從超算排名上看,當1994年首次出現(xiàn)該榜單時,每妙算力為1000多億次。今年最近一次排名中,人類的超算能力已經(jīng)達到了E級,即每秒浮點運算速度達到百億億次。和1994年相比,實現(xiàn)了百萬倍以上的算力提升。
邊緣側(cè)的算力同樣提升明顯,今年發(fā)布的第四代至強可擴展處理器,包含了高級矩陣擴展技術(shù)AMX,可直接對矩陣計算進行加速,無需進行項目拆解,無論是進行人工智能推理還是訓練,相比上代都實現(xiàn)了10倍的提升。
數(shù)據(jù)增加的背后則意味著人類在通訊和存儲能力上的提升。最直觀的變化正是存儲磁盤容量在快速提升,以及接口傳輸能力的突飛猛進。
英特爾在今年推出的Gaudi 2處理器就是一個很好的例證,不僅能提供大量的算力,還同時提供通訊能力。在近期MLPerf公司針對業(yè)界主流大模型的評測中,Gaudi 2成為全球唯二能提供針對大模型訓練極佳性能的產(chǎn)品。于此同時,Gaudi 2還擁有21個10萬兆內(nèi)部互連以太網(wǎng)接口(ROCEv2 RDMA)、96GB HBM2E高帶寬內(nèi)存(總帶寬2.4TB/s)。“對于大模型的平臺,它的能力要從計算、存儲和通訊能力進行綜合考慮!睆堄畈┦糠Q。
英特爾除了在算力、數(shù)據(jù)上通過硬件性能的升級,推動邊緣AI快速成長外,還正在通過軟件的方式實現(xiàn)“快樂”成長。
例如OpenVINO能夠幫助開發(fā)人員實現(xiàn)邊緣AI的快速部署與適配。開發(fā)人員可以選用一些人工智能框架,在框架上利用自己的訓練集設(shè)計網(wǎng)絡(luò)模型,最終形成一個模型的數(shù)據(jù)文件,該文件通過OpenVINO可以實現(xiàn)快速轉(zhuǎn)化,跟硬件進行適配、部署。OpenVINO還包含模型開發(fā)器與推理引擎兩個關(guān)鍵組件,讓開發(fā)人員的應(yīng)用只需一次開發(fā),便能利用OpenVINO的適配能力在不同硬件平臺實現(xiàn)部署,極大降低軟件開發(fā)成本,進一步減少邊緣AI的成長煩惱。
或許邊緣AI正像是一位剛剛在校園考出幾個不錯成績的孩子,它有成長的煩惱,更有無限的可能,因為它還有很長的成長之路,令人充滿遐想的巔峰時刻。英特爾正牽起它的小手,一道邁出一步又一步。