前一天在極越車內直播,第二天又為大模型工具“打call”,百度CEO李彥宏無縫銜接。4月16日,他花了約一個小時講解百度最新發(fā)布的AI開發(fā)工具,再度吐槽開源模型落后。像往年一樣,百度眾高管在Create大會上秀數據、講功能、談未來,但行業(yè)格局已大不一樣。
2023年3月,百度搶先發(fā)布文心大模型及產品文心一言,同年10月拿出最新版文心大模型4.0,一年時間文心一言用戶超2億。競爭對手的動作也不慢,月之暗面異軍突起,Sora表現震撼,文心一言AI應用老大的位置則遭到威脅。李彥宏說這一年百度開發(fā)AI原生應用踩了坑,交了學費。而當日百度以95港元在港交所開盤,收盤時股價94.15港元。
三個工具
上午9點多,李彥宏開講,《人人都是開發(fā)者》的題目和臺下的開發(fā)者和科技愛好者的適配度很高。
“過去,開發(fā)者用代碼改變世界;未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,”李彥宏強調,“未來開發(fā)應用就像拍個短視頻一樣簡單!
基于上述判斷,百度上新了“開發(fā)工具”:針對智能體開發(fā)的AgentBuilder、針對AI原生應用開發(fā)的AppBuilder,以及各種尺寸的模型定制工具ModelBuilder。
李彥宏認為,智能體可能是未來每一個人最近、最主流的大模型使用方式。百度升級的文心智能體平臺上有3萬多個智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。
智能體方面的進展也是瑞達恒研究院經理王清霖關注的內容,“具有更廣泛的發(fā)展前景,可以應用于C端的各種場景進行內容生成。由于這種模式的使用門檻低、場景多,可以兼顧工作與日常、個人與企業(yè),并且可以涉及到很多業(yè)態(tài)的多個環(huán)節(jié),看起來是更具有發(fā)展?jié)摿Φ模皇侨绾紊虡I(yè)變現是挑戰(zhàn)”。
AppBuilder是用來開發(fā)AI應用的,開發(fā)需要三步:給應用起名、在角色指令中描述具體要求、到工具組建中把代碼解釋器加進來,幫助運算。ModelBuilder可以根據開發(fā)者的需求定制任意尺寸的模型,并根據細分場景對模型進一步精調SFT。
演示這個功能時,李彥宏向小度詢問了一系列問題,包括新聞、日程安排等,“看起來是跟同一個在交流,其實背后調用了不同的模型”,有的是文心大模型4.0,有的是基于ERNIE Lite的精調模型。
看不上開源
“我們可以根據需要,兼顧效果、響應速度、推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,并且支持精調和post pretrain(一種預訓練模型的遷移學習方法)。這樣通過降維裁剪出來的模型,比直接拿開源調出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低。”李彥宏進一步說,“大家以前用開源覺得便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落后!
這不是他第一次吐槽開源大模型。據報道,李彥宏近日在內部講話中表示,大模型閉源是有真正的商業(yè)模式的,是能夠賺到錢的,最終才能聚集算力、聚集人才。
巧合的是,本月阿里云通義千問披露了最新開源(20.600, 0.00, 0.00%)進展,開源320億參數模型Qwen1.5-32B,此前已開源5億、18億、40億、70億、140億和720億參數6款大語言模型。阿里云相關人士告訴北京商報記者,上述大模型均已升級至1.5版本。此次開源的320億參數模型相比通義千問14B開源模型,在智能體場景下能力更強,相比通義千問72B開源模型,推理成本更低。
李彥宏也強調了成本,“通過這種大小模型的組合調度方式,小度完成了‘換腦行動’,裝上AI原生操作系統(tǒng)DuerOS X,相比全部使用文心大模型的旗艦版,響應速度提升2倍,成本下降99%”。
其實,大小模型組合不是百度獨有!敖裉旌芏嚅_源的軟件給的是百億(級別的)模型,跟ChatGPT不能比,但是在企業(yè)內部夠用的情況下,它的部署成本可以從原來的千萬美元降到千萬元甚至百萬元的級別。我覺得,這就真正達到了‘把大模型拉下神壇’的目標!360創(chuàng)始人周鴻祎在2023年8月說。
認知和落地
另一個總會占據百度Create大會不小篇幅的業(yè)務是出行。李彥宏是在談及多模態(tài)大模型上提到駕駛的。在他看來,“多模態(tài)大模型,或者說文字、圖片、語音、視頻等多模態(tài)的融合,是基礎模型非常重要的長期發(fā)展方向,是通往AGI(人工通用智能)的必經之路。視覺大模型最大的應用場景是自動駕駛”。
“李彥宏的認知沒有問題,但認知正確不代表能順利落地,”文淵智庫創(chuàng)始人王超告訴北京商報記者,“百度在人工智能的積累和開局不錯,但目前大規(guī)模商業(yè)化的能力欠缺!
2023年百度營收1345.98億元,較2022年增長9%,非公認會計準則下凈利潤287億元,較2022年增長39%。根據百度電話會議透露的信息,受益于通用人工智能和基礎模型,百度2023年四季度云業(yè)務產生6.56億元收入,這個數字在2024年全年將增長到數十億元。
換一個角度看數據。2023年12月百度App月活6.67億,該數字在2023年6月是6.77億。
來自QuestMobile的數據顯示,在AIGC(人工智能生成內容)領域,2024年1月,抖音的豆包、百度的文心一言、昆侖萬維(39.740, 0.00, 0.00%)的天工是國內月活躍用戶規(guī)模排名前三的App,當月月活分別是1756.9萬、1212.5萬、801.4萬。用戶超2億,那月活數據呢?北京商報記者就文心一言用戶數據采訪百度相關人士,其表示“未對外公布”。