飛象原創(chuàng)(高靖宇/文)站在2024年的技術(shù)十字路口,AI正在全面改造手機(jī)行業(yè),無論是在功能創(chuàng)新還是用戶體驗(yàn)上,AI驅(qū)動的手機(jī)都讓人眼前一亮。從硬件升級到智能化的深度融合,手機(jī)廠商都在加速擁抱AI。
對于手機(jī)廠商來說,AI不僅僅是“能做什么”,而是“能為你做什么”,如何讓AI“更懂你”,利用AI實(shí)現(xiàn)更高效的用戶體驗(yàn),這正是驅(qū)動AI手機(jī)未來發(fā)展的核心意義所在。
10月10日,2024 vivo開發(fā)者大會上,vivo正式發(fā)布“藍(lán)心智能”AI戰(zhàn)略,其中PhoneGPT(即“手機(jī)智能體”),是vivo基于藍(lán)心大模型技術(shù)做出的一次全新探索。而從“智能”到“智能體”這一字之差的變化,標(biāo)志著AI手機(jī)進(jìn)入到一個全新的個人智能體時代。
PhoneGPT:AI手機(jī)的全新蛻變
回想AI與手機(jī)的初遇,還是在Siri、Google Assistant等語音助手的出現(xiàn),讓人們第一次感受到了“智能”的觸手可及。用戶可以通過簡單的語音命令讓手機(jī)完成任務(wù),例如查詢天氣、設(shè)定提醒或是發(fā)短信。然而,這類助手的局限性很快顯現(xiàn):它們大多只能基于關(guān)鍵詞作出反應(yīng),無法真正理解用戶的意圖。你問,它答,流程機(jī)械而僵化,遠(yuǎn)不能稱之為“智能”。
大模型的應(yīng)用使得手機(jī)AI能力有了革命性的提升,“AI手機(jī)”已經(jīng)是完全不同的概念,AI技術(shù)在語音識別、圖像識別、智能推薦等方面更是取得了長足進(jìn)步,給用戶帶來了全新的使用體驗(yàn)。
不過,AI手機(jī)依然沒有擺脫“你問我答”的模式,也就是用戶必須清晰地表達(dá)命令,手機(jī)才能作出反應(yīng),遠(yuǎn)未達(dá)到“懂你”的地步。而vivo發(fā)布的PhoneGPT,具備自主拆解需求、主動規(guī)劃路徑、實(shí)時環(huán)境識別、動態(tài)反饋決策等能力?梢院唵蔚睦斫鉃,手機(jī)AI能力不再停留在單一功能層面,而是以“智能體”的形式具備了完整“思考”用戶需求的能力。
據(jù)vivo副總裁周圍介紹,PhoneGPT已可以準(zhǔn)確識別手機(jī)屏幕界面中的內(nèi)容,并自主操作手機(jī)的電話、短信等各類應(yīng)用程序,完成用戶交代的任務(wù)。
在演示中,藍(lán)心小V不僅可以對屏幕界面進(jìn)行識別和操作,也可以通過接管音頻進(jìn)行自主對話,以完成用戶交代的任務(wù),例如幫助我們?nèi)ビ啿蛷d、訂咖啡等等。
“這是手機(jī)自動化的一小步,卻是解放用戶雙手的一大步。”周圍稱,未來PhoneGPT會帶來更多的應(yīng)用場景,更好的智能體驗(yàn),讓小V成為更懂你的私人助理。
藍(lán)心智能:用AI重構(gòu)系統(tǒng)體驗(yàn)
PhoneGPT背后,是來自于vivo全新的AI戰(zhàn)略——藍(lán)心智能。藍(lán)心智能是將大模型技術(shù)與手機(jī)操作系統(tǒng)深度融合的個人智能。周圍解釋,以藍(lán)心大模型為技術(shù)底座,藍(lán)心智能可以理解用戶的個人情景和偏好,為用戶提供個人化的專屬服務(wù); 同時,藍(lán)心智能將全方位守護(hù)用戶的隱私安全; 通過系統(tǒng)深度融合,為用戶持續(xù)構(gòu)建更自然、符合直覺的交互,帶來更智能溫暖的體驗(yàn)。
為了達(dá)成這一點(diǎn),vivo從三個方面用AI重構(gòu)了系統(tǒng)體驗(yàn)。首先是重構(gòu)人與設(shè)備的交互體驗(yàn),讓交互更自然更符合直覺。在藍(lán)心大模型的加持下,手機(jī)將具備更強(qiáng)大的分析能力,多模態(tài)大模型都可以深度解讀你的意圖,進(jìn)而給你需要的反饋和服務(wù)。而依托文本大模型,讓藍(lán)心小V在文本能力外,進(jìn)一步具備強(qiáng)大的語音表征理解與生成能力,進(jìn)而讓手機(jī)能夠與人自然對話、翻譯語言、模擬人聲甚至理解對話中的情緒。
第二個方面是重構(gòu)人與數(shù)字世界的服務(wù)體驗(yàn),讓智能更加個人化,也就是構(gòu)建簡單高效的服務(wù)獲取能力和主動服務(wù)能力,讓人找服務(wù)的同時,服務(wù)也主動匹配人的需求。
第三個方面是重構(gòu)人與物理世界的連接體驗(yàn),讓溝通更順暢和溫暖。去年,vivo讀譜功能的發(fā)布,讓喜愛音樂的視障人士可以利用手機(jī)學(xué)習(xí)樂譜和樂器。而今,vivo利用多模態(tài)大模型,讓手機(jī)成為視障人士的眼睛,幫助他們跨越溝通的鴻溝。
藍(lán)心大模型矩陣:全面升級大模型能力
為進(jìn)一步夯實(shí)AI能力底座,vivo在今年的開發(fā)者大會上發(fā)布了全新自研藍(lán)心大模型矩陣。全面升級語言大模型和端側(cè)大模型能力,并帶來vivo自研的語音大模型、圖像大模型以及多模態(tài)大模型。這預(yù)示藍(lán)心智能,向著個人化和多元化發(fā)展邁出重要的一步。
在語言大模型上,千億級藍(lán)心云端大模型,重點(diǎn)優(yōu)化了意圖理解與分發(fā)和任務(wù)規(guī)劃能力。相比去年,整體能力提升30%,在SuperCLUE和C-EVAL榜單上繼續(xù)領(lǐng)跑國內(nèi)第一梯隊(duì)。
用戶的隱私安全始終是vivo打造藍(lán)心智能的首要原則,繼去年帶來了三款端側(cè)大模型之后,vivo正式發(fā)布全新30億參數(shù)量級的藍(lán)心端側(cè)大模型3B。在對話寫作、摘要總結(jié)、信息抽取等能力上,藍(lán)心3B可以越級比肩行業(yè)7B-9B模型。相比藍(lán)心7B,藍(lán)心 3B極致性能提升300%,平衡模式下功耗優(yōu)化達(dá)46%,極致出詞速度可以達(dá)到80字/s,系統(tǒng)功耗僅450mA,內(nèi)存占用僅1.4GB。在SuperCLUE和Equal Eval的小模型綜合能力評測中,藍(lán)心3B均排名第一,同時獲得了泰爾實(shí)驗(yàn)室端側(cè)大模型綜合能力認(rèn)證以及AIIA安全防范能力認(rèn)證。
除此之外,vivo還同步帶來了可以準(zhǔn)確理解自然語義,模擬人聲的全新自研藍(lán)心語音大模型、強(qiáng)化中國特色與東方美學(xué)的融合生成能力的藍(lán)心圖像大模型以及升級視覺感知理解能力的藍(lán)心多模態(tài)大模型。
周圍表示,藍(lán)心智能將以藍(lán)心大模型矩陣為技術(shù)底座,繼續(xù)探索AI與OS的深度融合,持續(xù)打造開放共贏的智能體生態(tài)。
未來已來,AI手機(jī)正在改變我們與世界的連接方式,你準(zhǔn)備好迎接PhoneGPT時代了嗎?