谷田表示,如何讓機(jī)器學(xué)會(huì)只錄取特定人和特定聲音是視頻會(huì)議音頻處理技術(shù)的重要研究方向,也是雅馬哈人工智能理念的體現(xiàn)。
首先,在網(wǎng)絡(luò)或視頻會(huì)議進(jìn)行的過(guò)程中,如果在開(kāi)放空間或者有來(lái)自投影儀等雜音源的場(chǎng)所,如何識(shí)別音源的位置是對(duì)視頻會(huì)議產(chǎn)品與技術(shù)的一個(gè)挑戰(zhàn)。
面對(duì)這個(gè)挑戰(zhàn),雅馬哈采取的對(duì)策是,使會(huì)議用傳聲揚(yáng)聲器可以根據(jù)場(chǎng)面的不同而采取不同的收音模式。該揚(yáng)聲器中的麥克風(fēng)陣列可以識(shí)別音源的位置,只收錄說(shuō)話(huà)人的聲音,并清楚地傳達(dá)給對(duì)方。具體到具備了這樣功能的PJP-100H上,它擁有三種特定模式:第一,區(qū)域模式:最適合在安靜環(huán)境下的會(huì)議,在場(chǎng)所有人的聲音都可被錄入;第二,點(diǎn)式模式:可收錄特定方向上的聲音;第三:追蹤模式,設(shè)備可以自動(dòng)追蹤發(fā)言人的聲音。
其次,視頻會(huì)議系統(tǒng)通常會(huì)面臨出差員工從外地接入,參加會(huì)議這樣的情況,臨時(shí)會(huì)議錄音功能非常重要。市場(chǎng)上現(xiàn)有的產(chǎn)品一般的解決思路是靠一臺(tái)筆記本電腦、軟件外加耳麥,組成臨時(shí)的視頻會(huì)議端點(diǎn)。但是,長(zhǎng)時(shí)間使用耳麥容易造成疲勞,也不利于兩位以上的出差員工同時(shí)參與。因此,雅馬哈研制了一系列輕巧、便于攜帶的Web會(huì)議用傳聲揚(yáng)聲器,采用USB供電的方式,供連接筆記本電腦使用。
針對(duì)此類(lèi)產(chǎn)品,谷田如此描述他們的技術(shù)設(shè)計(jì)思路:這類(lèi)小型揚(yáng)聲器具備和個(gè)人電腦、音樂(lè)播放器連接,以增強(qiáng)其使用率;但更重要的是,不能忽略其傳聲和會(huì)議錄音的功能,只錄最需要的聲音。在一次對(duì)此類(lèi)產(chǎn)品PJP-25UR的體驗(yàn)中,記者一邊利用揚(yáng)聲器大聲播放電腦中的音樂(lè),同時(shí)利用揚(yáng)聲器錄音現(xiàn)場(chǎng)的對(duì)話(huà)。最后播放錄音,里面只能聽(tīng)到記者說(shuō)話(huà)的聲音,完全沒(méi)有音樂(lè)等雜聲。田丸卓也表示,這是通過(guò)對(duì)揚(yáng)聲器和軟件的設(shè)定實(shí)現(xiàn)的。