文/李智勇
回退到五年前,可能并不會(huì)有人想到給Google造成最大麻煩的會(huì)是亞馬遜,Alexa的成功事實(shí)上正在對(duì)Google造成根本性威脅,F(xiàn)在再回頭看亞馬遜一路采取的行動(dòng),你會(huì)發(fā)現(xiàn)它幾乎每步都做對(duì)了:(1)從收購(gòu)三家語(yǔ)音公司打造Echo,(2)再到花4~5年打造一款產(chǎn)品的體驗(yàn)而不是草草拼湊一款好像能用的產(chǎn)品,(3)然后確定一個(gè)柱狀的ID而不是擬人態(tài)的機(jī)器人來(lái)降低用戶預(yù)期,(4)銷量一旦站到百萬(wàn)以上則開(kāi)放后端Alexa Skills Kit以及Amazon Voice Service,(5)再到最近的開(kāi)放七麥克風(fēng)陣列。幾乎每一步都高度務(wù)實(shí)和正確,與之相比有些國(guó)內(nèi)公司就顯的太想抄近路了。
從麥克風(fēng)陣列說(shuō)起
麥克風(fēng)陣列是把多個(gè)麥克風(fēng)組合在一起來(lái)對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并處理的系統(tǒng),形狀不局限于環(huán)形,而可以有線性、十字等。(更詳細(xì)的介紹,請(qǐng)參見(jiàn)聲智科技的陳孝良博士的文章,如:http://www.leiphone.com/news/201610/BSlh3Kf6wcqNCRH9.html)。亞馬遜Echo這產(chǎn)品雖然用到了很多技術(shù),也連接了很多內(nèi)容,但最為核心的部分正是麥克風(fēng)陣列。因?yàn)樵谥虸D下面,人們的預(yù)期已經(jīng)被大幅收窄,這樣內(nèi)容外的核心的體驗(yàn)點(diǎn)就只有速度和精度。而在遠(yuǎn)場(chǎng)語(yǔ)音交互中由于真實(shí)場(chǎng)景中各種干擾聲源的存在,精度的瓶頸就變成了聲學(xué),而不是已經(jīng)相對(duì)成熟的深度學(xué)習(xí)等。聲學(xué)技術(shù)中對(duì)最終體驗(yàn)比較關(guān)鍵的正是這次亞馬遜授權(quán)給第三方的:麥克風(fēng)陣列,喚醒、回聲抵消、降噪、去混響等算法,當(dāng)然還有一部分是融合到AVS中的已經(jīng)開(kāi)放出來(lái)的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別。
亞馬遜開(kāi)放自己的7-Mic陣列的本質(zhì)含義在于亞馬遜正式把Alexa的優(yōu)先級(jí)放在Echo這個(gè)產(chǎn)品之上;趤嗰R遜的7-Mic陣列以及配套技術(shù),理論上講少數(shù)其它公司是可以打造出交互體驗(yàn)與Echo一樣的產(chǎn)品的,而顯然的用亞馬遜陣列其背后必須集成的是亞馬遜的Alexa。
這很符合一個(gè)互聯(lián)網(wǎng)公司的本質(zhì)定位,Echo再怎么賣下去也很難讓亞馬遜變成蘋果,但Alexa如果成功則可以大幅侵蝕Google的市場(chǎng)份額。簡(jiǎn)單來(lái)講是這樣:Alexa占據(jù)搜索多少份額,Google就失去多少。這點(diǎn)上正好可以突出一個(gè)產(chǎn)品公司和互聯(lián)網(wǎng)公司的差別,蘋果嘗試過(guò)授權(quán)自己的操作系統(tǒng),但很快放棄了,這在產(chǎn)品公司的商業(yè)邏輯上是合理的;亞馬遜開(kāi)放自己的核心技術(shù),并授權(quán)給第三方,這在互聯(lián)網(wǎng)公司的商業(yè)邏輯下也是合理的。
亞馬遜的這次行動(dòng)可以平息掉行業(yè)里面一些很莫名其妙的爭(zhēng)論,比如兩個(gè)麥克風(fēng)就夠了等等。既然亞馬遜認(rèn)識(shí)到了對(duì)多麥克風(fēng)陣列的需求,并且NXP等也愿意跟進(jìn),那無(wú)疑的可以說(shuō)明多麥克風(fēng)陣列是市場(chǎng)必須的環(huán)節(jié)。這反過(guò)來(lái)可以襯托Google Home上的決策失誤,Google那什么來(lái)覆蓋多麥克風(fēng)陣列的市場(chǎng)?
正在形成的新行業(yè)
顯然的大家也會(huì)比較關(guān)注亞馬遜這樣的行動(dòng)會(huì)對(duì)國(guó)內(nèi)市場(chǎng)以及創(chuàng)業(yè)公司有什么樣的影響?
直接的影響其實(shí)不大,因?yàn)閲?guó)內(nèi)語(yǔ)音交互的啟動(dòng)速度眼下看比國(guó)外要慢個(gè)2~3年。但間接的影響其實(shí)并不小,因?yàn)閬嗰R遜的一系列行為本質(zhì)上是在開(kāi)啟一個(gè)新的分工鏈條,這個(gè)分工鏈條里很可能出現(xiàn)很多個(gè)百億市值的公司(想象下iPhone的產(chǎn)業(yè)鏈拉動(dòng)了多少百億市值的公司)。
很多人可能以為亞馬遜自己的授權(quán)行為會(huì)導(dǎo)致第三方技術(shù)提供商生存空間被壓縮,但其實(shí)正相反,在這個(gè)新開(kāi)啟的行業(yè)中會(huì)涌現(xiàn)出新的有實(shí)力的技術(shù)提供商。
因?yàn)閬嗰R遜的這種行動(dòng)本質(zhì)含義在于加速激活語(yǔ)音交互這個(gè)市場(chǎng)。假設(shè)我們前面的判斷正確,亞馬遜確實(shí)認(rèn)為Alexa遠(yuǎn)比Echo重要,那無(wú)疑的亞馬遜的核心使命是盡快為Alexa獲取客戶,這樣一來(lái)只用自己的麥克風(fēng)陣列(以及背后一系列技術(shù))來(lái)為Alexa獲取用戶顯然是極不明智的。那樣的話,Alexa用戶的增長(zhǎng)速度會(huì)與自己麥克風(fēng)陣列技術(shù)的銷售速度等同。同時(shí)做過(guò)聲學(xué)前端的人會(huì)知道,聲學(xué)前端事實(shí)上是一種只能適度標(biāo)準(zhǔn)化的技術(shù),也就是說(shuō)即使有80%的工作在一個(gè)產(chǎn)品上重用,但一旦遷移到第二個(gè)產(chǎn)品上還有至少20%的工作要調(diào)整,這和芯片有本質(zhì)差異。所以如果不能拉動(dòng)整個(gè)鏈條,只依賴于自己一個(gè)公司,那語(yǔ)音交互推開(kāi)的速度會(huì)極慢。所以如果亞馬遜足夠名字那一定會(huì)積極尋找第三方技術(shù)提供商,培育生態(tài),只有前端的生態(tài)鏈條足夠成熟并且有足夠的動(dòng)力支持亞馬遜,那么Alexa才可能真的加速普及。
國(guó)內(nèi)有的很多人被互聯(lián)網(wǎng)模式荼毒過(guò)深,會(huì)想當(dāng)然的覺(jué)得一切會(huì)免費(fèi),但可能并沒(méi)有意識(shí)到NXP這類大公司如果沒(méi)有合適的邊際利潤(rùn),那就根本沒(méi)和亞馬遜做下去的動(dòng)力。我們假設(shè)說(shuō)亞馬遜做成了Alexa,那亞馬遜可以得到Alexa整個(gè)生態(tài),那這時(shí)候NXP可以得到什么?也就是說(shuō)除非亞馬遜只是自己玩這游戲,否則如果想創(chuàng)建生態(tài)鏈條,那就需要為生態(tài)鏈條上的各個(gè)玩家留下利潤(rùn)空間。
這件事情上一個(gè)典型的反例是Google的Chrome Book,Chrome Book從體驗(yàn)上其實(shí)已經(jīng)基本滿足了用戶對(duì)筆記本的各種需求,甚至可能更加方便。但展開(kāi)上核心的一個(gè)問(wèn)題是Google并沒(méi)為第三方廠商留下足夠的利潤(rùn)空間,比如聯(lián)想使勁推這產(chǎn)品,但最終發(fā)現(xiàn)自己無(wú)法從中盈利,這時(shí)候即使有銷量,聯(lián)想這類公司顯然也動(dòng)力也不足。從過(guò)往戰(zhàn)略的明智程度上來(lái)看,亞馬遜不是Google,所以估計(jì)不會(huì)犯Google的錯(cuò)誤。
在這樣的大背景下,遠(yuǎn)場(chǎng)語(yǔ)音交互的新鏈條上,最有機(jī)會(huì)的反倒正是對(duì)前端有深刻理解的公司,這些公司幾乎每個(gè)都不可能通吃整個(gè)市場(chǎng),但考慮市場(chǎng)規(guī)模,只要占據(jù)20%的市場(chǎng)份額已經(jīng)足夠支撐起10億美元上估值的公司。在PC、手機(jī)上國(guó)內(nèi)公司參與這個(gè)分工鏈條比較晚,所以這個(gè)部分幾乎全是海外公司,但眼下聲智科技這樣的創(chuàng)業(yè)公司正在嘗試在其中搶占合適的位置。
亞馬遜開(kāi)放7-Mic陣列授權(quán)后,Google、微軟等預(yù)計(jì)會(huì)采取相應(yīng)行動(dòng),因?yàn)閬嗰R遜的授權(quán)顯然不會(huì)允許支持Google Assistant與Cortana。
國(guó)內(nèi)語(yǔ)音交互的發(fā)展
國(guó)內(nèi)其實(shí)是缺一款能和Echo媲美的標(biāo)桿性產(chǎn)品,沒(méi)有這樣一款產(chǎn)品,大家就沒(méi)法相信語(yǔ)音交互是普遍可用的。聲智科技等公司可以提供與亞馬遜水平相當(dāng)?shù)倪h(yuǎn)場(chǎng)語(yǔ)音交互技術(shù),但顯然的把這種技術(shù)轉(zhuǎn)化為產(chǎn)品體驗(yàn)仍然需要合適的人與足夠的投入進(jìn)行打磨。
沒(méi)有這樣一種標(biāo)桿性產(chǎn)品,那就只會(huì)有各種簡(jiǎn)單嘗試,但這種簡(jiǎn)單嘗試基本上都只會(huì)得到體驗(yàn)較差的產(chǎn)品,無(wú)法擔(dān)負(fù)起激活市場(chǎng)的重任(想想iPhone和Echo)。這很像用火柴燒水的那個(gè)比喻:只要還是單根火柴,那不管你用多少根事實(shí)上都無(wú)法燒開(kāi)一壺水,只有把足夠多的火柴放在一起,一起點(diǎn)燃,那才能最終把水燒開(kāi)。
顯然的突破語(yǔ)音交互只有兩個(gè)瓶頸:一個(gè)是技術(shù)上的這就包括了交互的速度和精度,這只能依賴技術(shù)提供商來(lái)突破;一個(gè)是用戶習(xí)慣上的,這需要硬指標(biāo)與內(nèi)容同步突破。這兩者的突破都需要沉淀和打磨。而國(guó)內(nèi)的很多嘗試更像是重復(fù):迅速點(diǎn)燃火柴,嘗試迅速的燒開(kāi)水,然后發(fā)現(xiàn)水沒(méi)開(kāi)這樣一個(gè)過(guò)程。
這點(diǎn)上其實(shí)需要大公司扮演更多的角色,因?yàn)槠渫度牒彤a(chǎn)出都會(huì)比較大。打造一個(gè)平庸的產(chǎn)品可能只需要1百萬(wàn),但打造一個(gè)足夠有說(shuō)服力的產(chǎn)品可能需要5000萬(wàn)以上,這對(duì)創(chuàng)業(yè)公司挑戰(zhàn)確實(shí)會(huì)比較大。但收益顯然也是巨大的,假設(shè)說(shuō)騰訊花了1億RMB打造了一款像Echo一樣的產(chǎn)品,那其它人即使打造了完全一樣的產(chǎn)品,很多人也會(huì)更傾向于活在騰訊的生態(tài)下(這正是Google尷尬的地方)。反過(guò)來(lái)講,這意味著誰(shuí)第一個(gè)在國(guó)內(nèi)打造出了一個(gè)成功的產(chǎn)品,誰(shuí)更有可能扮演亞馬遜的角色,去挑戰(zhàn)既有搜索市場(chǎng)的格局。
小結(jié)
亞馬遜發(fā)功越來(lái)越有穩(wěn)準(zhǔn)狠的勢(shì)頭,但不管怎樣,我估計(jì)它那產(chǎn)品進(jìn)不來(lái)中國(guó)。