麻省理工開發(fā)計(jì)算機(jī)模型 模擬人腦對(duì)聲音方位判斷
人類的大腦經(jīng)過精細(xì)的調(diào)整,不僅能識(shí)別特定的聲音,而且還能確定聲音來自哪個(gè)方向。通過比較到達(dá)右耳和左耳的聲音差異,大腦可以估計(jì)出狗叫、消防車呼嘯或汽車駛來的位置。麻省理工學(xué)院的神經(jīng)科學(xué)家們現(xiàn)在已經(jīng)開發(fā)了一個(gè)計(jì)算機(jī)模型,它也可以執(zhí)行這一復(fù)雜的任務(wù)。該模型由幾個(gè)卷積神經(jīng)網(wǎng)絡(luò)組成,不僅能像人類一樣完成任務(wù),而且還能以人類的方式進(jìn)行判斷。
這個(gè)模型可以在現(xiàn)實(shí)世界中實(shí)際定位聲音,而當(dāng)研究人員把這個(gè)模型當(dāng)作人類的實(shí)驗(yàn)參與者,并模擬過去對(duì)人類進(jìn)行的實(shí)驗(yàn)時(shí),研究人員一次又一次地發(fā)現(xiàn),這個(gè)模型再現(xiàn)了在人類身上看到的結(jié)果。這項(xiàng)新研究的發(fā)現(xiàn)還表明,人類感知位置的能力是適應(yīng)我們環(huán)境具體挑戰(zhàn)的。 該論文于2022年1月27日發(fā)表在《自然-人類行為》上。
當(dāng)我們聽到火車鳴笛等聲音時(shí),聲波到達(dá)我們左右耳朵的時(shí)間和強(qiáng)度略有不同,這取決于聲音來自哪個(gè)方向。中腦的一部分專門用來比較這些微小的差異,以幫助估計(jì)聲音來自哪個(gè)方向,這項(xiàng)任務(wù)也被稱為定位。在現(xiàn)實(shí)世界的條件下,這項(xiàng)任務(wù)變得明顯更加困難,環(huán)境會(huì)產(chǎn)生回聲,同時(shí)會(huì)聽到許多聲音。
科學(xué)家們長期以來一直在尋求建立計(jì)算機(jī)模型,以執(zhí)行與大腦用來定位聲音的那種計(jì)算方法。這些模型有時(shí)在沒有背景噪音的理想化環(huán)境中能很好地工作,但在有噪音和回聲的真實(shí)世界環(huán)境中卻從未成功。為了開發(fā)一個(gè)更復(fù)雜的定位模型,麻省理工學(xué)院的團(tuán)隊(duì)轉(zhuǎn)向了卷積神經(jīng)網(wǎng)絡(luò)。這種計(jì)算機(jī)建模已被廣泛用于人類視覺系統(tǒng)建模。為了訓(xùn)練這些模型,研究人員創(chuàng)建了一個(gè)虛擬世界,他們可以在其中控制房間的大小和房間墻壁的反射特性。所有輸入模型的聲音都來自于這些虛擬房間中的某個(gè)地方。這套400多個(gè)訓(xùn)練聲音包括人類的聲音、動(dòng)物的聲音、機(jī)器的聲音,如汽車引擎,以及自然的聲音,如雷聲。
卷積神經(jīng)網(wǎng)絡(luò)可以設(shè)計(jì)成許多不同的架構(gòu),所以為了幫助他們找到對(duì)定位最有效的網(wǎng)絡(luò),麻省理工學(xué)院的團(tuán)隊(duì)使用了一臺(tái)超級(jí)計(jì)算機(jī),讓他們訓(xùn)練和測試大約1500個(gè)不同的模型。這一搜索確定了10個(gè)似乎最適合定位的模型,研究人員進(jìn)一步訓(xùn)練了這些模型,并將其用于所有后續(xù)研究。研究人員還確保該模型從人類耳朵提供的相同信息開始。外耳,即耳廓,有許多褶皺可以反射聲音,改變進(jìn)入耳朵的頻率,而這些反射會(huì)根據(jù)聲音的來源而變化。研究人員通過在每個(gè)聲音進(jìn)入計(jì)算機(jī)模型之前通過一個(gè)專門的數(shù)學(xué)函數(shù)來模擬這種效果。
訓(xùn)練完模型后,研究人員在真實(shí)世界的環(huán)境中對(duì)它們進(jìn)行了測試。他們將一個(gè)耳朵上有麥克風(fēng)的人體模型放在一個(gè)實(shí)際的房間里,播放來自不同方向的聲音,然后將這些錄音輸入模型。當(dāng)被要求對(duì)這些聲音進(jìn)行定位時(shí),這些模型的表現(xiàn)與人類非常相似。盡管模型是在虛擬世界中訓(xùn)練的,但當(dāng)我們?cè)u(píng)估它時(shí),它可以在現(xiàn)實(shí)世界中定位聲音。
關(guān)鍵詞: 最新消息 麻省理工開發(fā)計(jì)算機(jī)模型 模擬人腦對(duì)聲音方位判
相關(guān)新聞