首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 新聞列表 >> 正文

百度移動(dòng)互聯(lián)網(wǎng)戰(zhàn)略:“深度學(xué)習(xí)”配合大數(shù)據(jù)

2013年8月12日 18:11  移動(dòng)互聯(lián)網(wǎng)  

    路線選擇的不同,使百度與騰訊、阿里的移動(dòng)互聯(lián)網(wǎng)戰(zhàn)略可比性越來越弱。但百度的這個(gè)戰(zhàn)略也面臨挑戰(zhàn),最大的不確定性來自于數(shù)據(jù)的來源

    要搞清楚一個(gè)互聯(lián)網(wǎng)公司當(dāng)下的主要戰(zhàn)略方向其實(shí)并不難,只要看它們的創(chuàng)始人在干嘛,基本就能猜個(gè)八九不離十。以這個(gè)標(biāo)準(zhǔn)看,騰訊的馬化騰在抓手機(jī)QQ,搜狐的張朝陽逼著自己看雷人電視劇,新浪的曹國偉當(dāng)然還是在發(fā)微博,阿里巴巴的馬云……退休了……

    百度的李彥宏在做什么?他在年初成立了深度學(xué)習(xí)研究院(InstituteofDeepLearning,IDL)并自任院長,親自出馬去延攬人才,并在全公司群發(fā)郵件介紹這些來自Facebook等硅谷巨頭的技術(shù)專家。“以前就算是VP入職,也是HR和分管高管發(fā)郵件介紹而已啊!比烨,一位百度員工看著又一封Robin發(fā)出的新進(jìn)專家介紹郵件說。

    深度學(xué)習(xí)對百度有啥用?

    今年3月,一位在Google領(lǐng)導(dǎo)重要研究項(xiàng)目的人物低調(diào)來訪百度,還去清華大學(xué)講了次課。淼叔當(dāng)時(shí)發(fā)了一條微博,說他會(huì)見了一堆百度的技術(shù)高管,還可能幫百度在硅谷的研究員招兵買馬。

    這個(gè)人就是AndrewNg(吳恩達(dá))。在他來訪百度之后不久,即入選《時(shí)代》雜志年度全球最有影響力100人,成為16位科技界代表之一。吳恩達(dá)現(xiàn)任斯坦福大學(xué)人工智能實(shí)驗(yàn)室主任。他與大公司合作的一個(gè)項(xiàng)目,則代表了互聯(lián)網(wǎng)巨頭的下一步方向:這個(gè)項(xiàng)目,叫做GoogleBrain,它的領(lǐng)域,就是深度學(xué)習(xí)。

    鑒于百度發(fā)布的研究成果比較少,我們可以用吳恩達(dá)取得的一些成果來側(cè)面看看深度學(xué)習(xí)能干些什么:去年,吳恩達(dá)領(lǐng)導(dǎo)Google的科學(xué)家們,用16000臺(tái)電腦模擬了一個(gè)模擬人腦神經(jīng)網(wǎng)絡(luò)出來,并向這個(gè)網(wǎng)絡(luò)展示了1000萬段隨機(jī)從Youtube上選取的視頻,看看它能學(xué)會(huì)什么。結(jié)果在完全沒有外界干涉的條件下,它自己識(shí)別出了貓臉。

    我們要注意的是,這種機(jī)器學(xué)習(xí)與我們通常意義上說的“機(jī)器識(shí)別”有所不同,F(xiàn)有的很多此類識(shí)別,需要人工輸入一些用于對比的數(shù)據(jù),或者一些已經(jīng)進(jìn)行初步分類、打好標(biāo)簽的數(shù)據(jù),機(jī)器通過學(xué)習(xí)這些數(shù)據(jù)的共同點(diǎn),得出規(guī)律,然后再去將規(guī)律應(yīng)用于更大規(guī)模的數(shù)據(jù)中。粗略地說,這是一種“有監(jiān)督的學(xué)習(xí)”,需要人工輸入初始數(shù)據(jù),有時(shí)候還要對識(shí)別結(jié)果進(jìn)行判斷,由此促進(jìn)機(jī)器的學(xué)習(xí)速度。

    而深度學(xué)習(xí)是一種“無監(jiān)督的學(xué)習(xí)”。它基于一種學(xué)術(shù)假設(shè):即人類對外界環(huán)境的了解過程最終可以歸結(jié)為一種單一算法,而人腦的神經(jīng)元可以通過這種算法,分化出識(shí)別不同物體的能力。這個(gè)識(shí)別過程甚至完全不需要外界干預(yù)。

    還是以識(shí)別貓臉為例:吳恩達(dá)給神經(jīng)網(wǎng)絡(luò)輸入了一個(gè)單詞“cat”,這個(gè)神經(jīng)網(wǎng)絡(luò)中并沒有辭典,不了解這個(gè)單詞的含義。但在觀看了一千萬段視頻,它最終確定,cat就是那種毛茸茸的小動(dòng)物。這個(gè)學(xué)習(xí)過程,與一個(gè)不懂英語的人,在沒任何人教他的時(shí)候,通過獨(dú)立觀察學(xué)會(huì)“cat”的過程幾乎一致。

    現(xiàn)在我們可以看出,深度學(xué)習(xí)對百度有什么意義了。最基本的,在門檻上,這個(gè)領(lǐng)域不是誰都能隨便進(jìn)來的,它需要有龐大的計(jì)算能力,海量的人類知識(shí)數(shù)據(jù);更重要的,它能夠完全自主地學(xué)習(xí)并數(shù)字化這個(gè)世界——然后就可以讓人們搜索任何東西啦。

    深度學(xué)習(xí)對互聯(lián)網(wǎng)業(yè)務(wù)有什么幫助?

    現(xiàn)在我們可以看看百度在深度學(xué)習(xí)方面做了哪些工作。年初,百度建立了深度學(xué)習(xí)研究院;隨后,百度硅谷人工智能實(shí)驗(yàn)室成立,這個(gè)實(shí)驗(yàn)室與Google相距只有六英里,方便一些硅谷的人才直接在本地展開研究;5月,F(xiàn)acebook資深科學(xué)家徐偉宣布加盟百度,他此前負(fù)責(zé)的項(xiàng)目是“大規(guī)模推薦系統(tǒng)”,更往前,他在NEC美國研究院從事神經(jīng)網(wǎng)絡(luò)底層的研究。6月,李彥宏群發(fā)了他今年第二封新員工介紹郵件:曾任職IBM研究院、雅虎研究院的機(jī)器學(xué)習(xí)專家張潼加入。

    這些是在人才架構(gòu)上的動(dòng)作。而在實(shí)際成果方面,深度學(xué)習(xí)的應(yīng)用已經(jīng)在2012年就出現(xiàn)了。百度多媒體業(yè)務(wù)負(fù)責(zé)人余凱用淼叔做實(shí)驗(yàn)對象,演示了人臉?biāo)阉髂芰。可能是出于?qiáng)化戲劇性效果以便于傳播的考慮,這個(gè)產(chǎn)品叫“明星臉?biāo)阉鳌。?shí)驗(yàn)對象實(shí)時(shí)拍一張照片,百度可以搜索出這張照片最像哪個(gè)明星——但令人驚奇的是,在百度作為參考列出的互聯(lián)網(wǎng)圖片搜索照片中,第一張就是淼叔10年前拍的一張照片。也就是說,在沒有任何其他條件限定的前提下,百度根據(jù)一個(gè)現(xiàn)實(shí)場景,找到了一個(gè)確定的人。

    由于計(jì)算機(jī)的高度普及,很多人可能已經(jīng)固化了“搜索”的印象:面對屏幕上的一個(gè)輸入框,敲入一串詞語,電腦返回一堆鏈接,用戶再逐個(gè)點(diǎn)開查看哪個(gè)是自己需要的內(nèi)容。但當(dāng)我們要教會(huì)從沒接觸過電腦的父母這一搜索過程時(shí),就發(fā)現(xiàn)它與人類天生的本能并不相同:父母們往往會(huì)指著一株不知名的植物,問電腦是否能告訴我們這是什么;他們也并不習(xí)慣鍵入文字內(nèi)容(甚至還不會(huì)輸入法),更希望對著電腦說一句“明天什么天氣”就能得到答案。

    傳統(tǒng)的搜索,其交互方式是人工提煉出關(guān)鍵詞輸入,才返回答案。所以使用搜索引擎其實(shí)是一種技術(shù),考驗(yàn)的是人能否準(zhǔn)確觀察問題、恰當(dāng)提煉主題詞,做到這些才有可能得到自己想要的信息。這就與一切搜索引擎“公平地為每個(gè)人提供信息”的初衷相悖了。

    而深度學(xué)習(xí)的技術(shù)配合上大數(shù)據(jù)的儲(chǔ)備,語音搜索、圖像搜索等新興技術(shù)就不再僅僅是技術(shù)的噱頭,而是將搜索用戶從數(shù)億拓展到數(shù)十億的大生意。這也是Google、蘋果和百度紛紛在語音搜索上推出新產(chǎn)品的原因。

    百度的移動(dòng)互聯(lián)網(wǎng)戰(zhàn)略:抄后路

    在PC互聯(lián)網(wǎng)上,新搜索方式的出現(xiàn)可能僅僅是擴(kuò)大用戶規(guī)模。但在移動(dòng)互聯(lián)網(wǎng)上,這種變革可能是生死之爭。

    手機(jī)的小屏幕決定,用戶不可能像在PC上一樣順暢高速輸入,手機(jī)的麥克風(fēng)和攝像頭是比鍵盤普及得多的輸入方式。而對語音搜索和圖像搜索快速、高效地給出識(shí)別與匹配的結(jié)果,這正是深度學(xué)習(xí)所擅長的領(lǐng)域。所以百度語音助手雖然去年才推出,卻在效果與一些專業(yè)做這個(gè)領(lǐng)域好幾年的公司打成平手,語音搜索也一舉占據(jù)了百度移動(dòng)搜索10%的流量。在語音識(shí)別準(zhǔn)確率方面,百度2012年一年的進(jìn)展就超過了過去15年進(jìn)展的總和。同樣,百度圖像識(shí)別技術(shù)應(yīng)用于全網(wǎng)搜索以后,以圖搜圖的準(zhǔn)確率一下子從20%提升到80%。

    更重要的,除了入口之外,基于深度學(xué)習(xí)的大數(shù)據(jù)處理,將覆蓋整個(gè)移動(dòng)互聯(lián)網(wǎng)的“后臺(tái)”。移動(dòng)互聯(lián)網(wǎng)與云計(jì)算和大數(shù)據(jù)其實(shí)是一體兩面的事務(wù),高度移動(dòng)化的手機(jī)等設(shè)備決定了它不會(huì)具有很強(qiáng)的運(yùn)算能力,手機(jī)更多地是采集各類數(shù)據(jù),將之傳送到云計(jì)算平臺(tái),得到結(jié)果后再返回手機(jī),供用戶使用。將來的各類可穿戴設(shè)備也將是這種模式。

    所以,在騰訊、阿里紛紛基于APP展開研發(fā)與收購時(shí),百度在這個(gè)領(lǐng)域顯得相對沉寂。其實(shí)從去年9月百度世界的戰(zhàn)略發(fā)布上,就可以看出李彥宏的算盤:他希望在后臺(tái)提供整個(gè)云計(jì)算能力,加上百度這些年積累的最為豐富的中文數(shù)據(jù)與搜索需求,支撐開發(fā)者研發(fā)、發(fā)布各種APP。這樣,即使百度沒有任何前端的APP產(chǎn)品,也依然掌握了移動(dòng)互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施。

    百度無線事業(yè)部總經(jīng)理岳國鋒給我們盤點(diǎn)了百度開放給開發(fā)者提供的云開發(fā)能力與系統(tǒng)保障服務(wù):云儲(chǔ)存PCS、應(yīng)用引擎BAE、云推送PUSH、位置服務(wù)LBS、自測平臺(tái)MTC、眾測平臺(tái)、移動(dòng)統(tǒng)計(jì)、開放平臺(tái)提交、移動(dòng)聯(lián)運(yùn)平臺(tái)、In-AppAds?梢钥吹,既有開發(fā)、儲(chǔ)存方面的服務(wù),也有發(fā)行、營銷能力的支持,還在移動(dòng)變現(xiàn)方面進(jìn)行了探索。

    路線選擇的不同,使百度與騰訊、阿里的移動(dòng)互聯(lián)網(wǎng)戰(zhàn)略可比性越來越弱(其中阿里巴巴著眼于提供電商生態(tài)平臺(tái)的建設(shè),與百度的抄后路戰(zhàn)略略微相似)。但百度的這個(gè)戰(zhàn)略也面臨挑戰(zhàn),最大的不確定性來自于數(shù)據(jù)的來源:騰訊擁有大量基于用戶明確ID的行為數(shù)據(jù),阿里巴巴則擁有整個(gè)互聯(lián)網(wǎng)價(jià)值最高的電商流量數(shù)據(jù)。在PC互聯(lián)網(wǎng)上,百度擁有搜索框入口;但在移動(dòng)互聯(lián)網(wǎng)上,殺手級(jí)APP的匱乏,可能會(huì)導(dǎo)致百度在數(shù)據(jù)采集方面腳步放慢。在移動(dòng)用戶飛速增長的大前提下,如何再造移動(dòng)入口,通過大數(shù)據(jù)“深度學(xué)習(xí)”出移動(dòng)互聯(lián)網(wǎng)的未來?這或許是百度面臨的關(guān)鍵挑戰(zhàn)。

編 輯:劉妍
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬倚聞澐至酥蓄l段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國5G商用四周年
2023年中國國際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像