但實(shí)際上,人類之間的語(yǔ)音交互都會(huì)拉開一定距離。所以,現(xiàn)在我們開始需要機(jī)器適應(yīng)人類的遠(yuǎn)場(chǎng)語(yǔ)音交互。
機(jī)器適應(yīng)人類,這可以說(shuō)是計(jì)算機(jī)技術(shù)的一個(gè)巨大進(jìn)步,也是人工智能得以實(shí)現(xiàn)的核心要素之一。
這并非聲學(xué)領(lǐng)域特有的問(wèn)題,當(dāng)汽車安裝攝像頭和雷達(dá),以及自行車安裝 GPS 時(shí),場(chǎng)景變化帶來(lái)的技術(shù)挑戰(zhàn)才會(huì)凸顯出來(lái),因?yàn)檎鎸?shí)場(chǎng)景所需要的技術(shù)并非是簡(jiǎn)單升級(jí)而是顛覆性創(chuàng)新。這也是當(dāng)前技術(shù)型創(chuàng)業(yè)公司被青睞的主要原因。
然而,單一傳感方式所帶來(lái)的影響總是有限,不足以推動(dòng)整個(gè)技術(shù)和社會(huì)的變革。例如,麥克風(fēng)陣列可以采集人類自然對(duì)話的語(yǔ)音信息,從而逐漸演化、理解人類語(yǔ)言。這意味著將來(lái)機(jī)器可以讀懂我們的思想,十分可怕。但這種理解其實(shí)還比較片面,缺乏圖像、位置等其他傳感信息的支持。
從這個(gè)層面來(lái)說(shuō),人工智能必須融合多種傳感方式,而非局限于聲、光、電、熱、力、磁,再加上強(qiáng)大的計(jì)算和存儲(chǔ)能力,才能在某些領(lǐng)域超越人類,從而看懂世界,推動(dòng)更多新商業(yè)模式的誕生。
當(dāng)機(jī)器獲取的融合數(shù)據(jù)足以覆蓋人類產(chǎn)生的數(shù)據(jù)的十分之一時(shí),大多時(shí)候,人類只需要說(shuō)一說(shuō)、看一看或者想一想,機(jī)器就能捕捉到背后的思想。
未來(lái)到底會(huì)產(chǎn)生哪些新的商業(yè)模式,我們尚不可知。但有一點(diǎn)可以肯定,廣告模式肯定不是人工智能時(shí)代的商業(yè)模式