9月13日電 隨著生成式人工智能的發(fā)展,對大語言模型的需求越發(fā)明顯。日前在沙特首都利雅得舉行的第三屆全球人工智能峰會上,沙特數(shù)據(jù)與人工智能局發(fā)布了目前最大規(guī)模的阿拉伯語大語言模型,與會代表探討如何讓人工智能技術(shù)賦能阿拉伯世界,在全球化中保護(hù)語言、身份和文化的多樣性。
沙特數(shù)據(jù)與人工智能局介紹說,該機(jī)構(gòu)研發(fā)的擁有70億個參數(shù)的阿拉伯語大語言模型ALLaM已經(jīng)上線微軟的云平臺,訓(xùn)練數(shù)據(jù)集包含5千億個阿拉伯語基本文本單元。
與會嘉賓表示,在發(fā)展大語言模型中保護(hù)文化身份,首先還是來自高質(zhì)量數(shù)據(jù)集的挑戰(zhàn)。要收集多樣化的數(shù)據(jù)集,包括方言、習(xí)語和文化的細(xì)微差別。這種數(shù)據(jù)的多樣性使人工智能不僅可以作為一種技術(shù)工具,也可以作為跨越文化鴻溝的橋梁。模型訓(xùn)練過程中,需要聘請來自不同文化的數(shù)據(jù)標(biāo)注者,盡管這是一個復(fù)雜且昂貴的過程,但對于確保人們平等受益于大型語言模型帶來的技術(shù)進(jìn)步,保證人工智能的普惠性非常重要。
人工智能公司Emotech首席執(zhí)行官莊宏斌在此次大會的主旨演講中,介紹了“小語言模型”的概念。小型語言模型,是大型語言模型的緊湊版本。它們旨在高效執(zhí)行語言相關(guān)任務(wù),同時消耗較少的計算資源。與可能由數(shù)千億個參數(shù)組成的大型語言模型不同,小型語言模型的特點是參數(shù)數(shù)量較少,適合數(shù)據(jù)資源有限的方言語言模型,適合部署在移動設(shè)備或邊緣計算設(shè)備等資源受限的環(huán)境中。
與會嘉賓表示,隨著人工智能技術(shù)的發(fā)展,其在調(diào)整和塑造人類互動文化方面的潛力也在增長。然而,挑戰(zhàn)在于如何確保這些技術(shù)的開發(fā)具有包容性,尊重全球用戶的語言和文化多樣性。技術(shù)的包容性和語言文化的多樣性應(yīng)作為未來真正全球人工智能格局的基礎(chǔ)。
第三屆全球人工智能峰會于10日至12日在利雅得舉行,峰會主題是“利用人工智能造福人類”。