北京時間5月15日凌晨,谷歌舉辦了年度I/O開發(fā)者大會。正如外界預(yù)期,人工智能成為這次大會的核心內(nèi)容。根據(jù)發(fā)布會官方統(tǒng)計,兩個小時的開發(fā)者大會共提及“人工智能(AI)”121次。會上,谷歌發(fā)布了眾多有關(guān)AI的產(chǎn)品和服務(wù),AI“全家桶”的創(chuàng)新性如何,引發(fā)外界關(guān)注。
具體來看,谷歌對旗下的AI大模型雙子座(Gemini)進(jìn)行了重要升級,使其可理解的信息量翻番,谷歌還通過對數(shù)據(jù)和算法的改進(jìn)增強雙子座大模型的代碼生成、邏輯推理和規(guī)劃、多輪對話以及音頻和圖像理解能力。谷歌推出的AI助手Project Astra可以通過視頻和音頻的方式進(jìn)行識別,不僅支持實時對話,還能通過視頻聊天的方式與用戶進(jìn)行交互。同時,谷歌也發(fā)布了自己的視頻生成模型Veo,可以根據(jù)文字、圖片和視頻的提示,生成各種風(fēng)格的高質(zhì)量視頻,將成為Sora新的勁敵。此外,谷歌還發(fā)布了第六代Tensor處理器單元(TPU)芯片Trillium,谷歌首席執(zhí)行官(CEO)桑達(dá)爾·皮查伊表示,新產(chǎn)品的算力表現(xiàn)提升了4.7倍。
谷歌此次將AI功能深度融入搜索引擎和辦公領(lǐng)域中。發(fā)布會結(jié)束后,谷歌搜索引擎將在美國推出“AI概覽”功能,賦予搜索引擎多步驟推理的能力和計劃能力。雙子座大模型也將接入谷歌郵件服務(wù)Gmail,不僅可以總結(jié)郵件內(nèi)容,還可以根據(jù)上下文語境智能提供回復(fù)內(nèi)容。在手機端,谷歌也明確將在最新發(fā)布的安卓15系統(tǒng)中加入雙子座大模型,提供更多AI服務(wù)。
從大模型到人工智能助手,從應(yīng)用再到芯片,谷歌對AI“全家桶”進(jìn)行了全面升級。谷歌以搜索為核心,以安卓系統(tǒng)為根據(jù)地,打造全面而豐富的AI產(chǎn)品矩陣,同時通過升級內(nèi)存容量和整體系統(tǒng)帶寬提升TPU性能,為AI應(yīng)用提供支持。
就在谷歌舉辦開發(fā)者大會的前一天,OpenAI舉辦新品發(fā)布會,推出一款名為GPT-4o的人工智能模型。與現(xiàn)有模型相比,它可以同時理解文本、圖像、音頻等,并能將其任何組合作為輸入或輸出。新模型甚至能夠讀取人的情緒,在人機交互方面的體驗更為順暢。
OpenAI和谷歌接連推出新品,兩家的產(chǎn)品不免被人拿來比較。從發(fā)布會上看,具體產(chǎn)品似乎各有所長。以此次引起關(guān)注的AI助手為例,Astra的視覺理解能力較好,但在交互體驗上要比GPT-4o實時演示的能力差。從整體的創(chuàng)新方向來看,以往OpenAI更側(cè)重于AI技術(shù)的突破和創(chuàng)新,谷歌則更注重生態(tài)系統(tǒng)的深化與整合,不過,兩家公司在技術(shù)上的差距正在縮小,而且都在努力推動AI應(yīng)用于更廣泛的場景。有評論認(rèn)為,和GPT-4o不到30分鐘的發(fā)布會相比,谷歌缺乏驚喜,但從生態(tài)和用戶積累上,谷歌依然具有先天優(yōu)勢。隨著新品接連落地應(yīng)用,圍繞生成式AI的競賽也日趨激烈。