一、研究背景:
隨著智能機器人技術迅猛發展,基于聲學傳感器的人機交互(HMI)在促進機器人實現自然高效通信方面扮演著至關重要的角色。然而,如何準確識別和跟蹤全向聲源,特別是在嘈雜的環境中實現該目的,仍然是一個亟待解決的難題。
二、文章簡介:
針對上述問題,北京納米能源與系統研究所王杰研究員團隊成功研發出一種具有全向聲音識別和跟蹤能力的自供電摩擦電立體聲傳感器(SAS),為解決這一問題提供了創新性的解決方案。SAS采用了具有高電子親和力和低楊氏模量的多孔振動膜,使其具有高靈敏度(3172.9mVppPa-1)和寬頻率響應范圍(100-20,000 Hz)。利用其的聲音識別能力和可調的諧振頻率特性,SAS即使在嘈雜的環境中也能精確識別所需的音頻信號,平均深度學習準確率達到約98%。該傳感器的研發不僅解決了智能機器人在復雜環境中聲音識別的難題,還為其在多個領域的應用開辟了廣闊前景。例如,在輔助會議系統中,SAS可以同時識別多個個體的聲音,提高會議效率;在自動駕駛汽車領域,它能夠在背景音樂下準確識別駕駛命令,確保行車安全。這些應用展示標志著基于語音的人機界面系統取得了顯著進步。相關研究成果發表于Advanced Materials上。作者為北京納米能源與系統研究所博士喬文艷,通訊作者為北京納米能源與系統研究所周靈琳副研究員和王杰研究員
三、研究內容:
1.傳感器結構及工作原理 在探索更高效、更自然的人機交互(HMI)系統的進程中,聲學傳感器扮演著至關重要的角色。作為機器人的“聽覺"裝置,聲學傳感器能夠精準地識別人類的指令、語音內容及語調,極大地促進了機器人與人類之間的社會互動。本文提出了一種創新的SAS,通過在3D打印的立體框架上集成五個層狀結構的自供電摩擦電聲音傳感器(TAS),實現了對聲音信號的全向捕捉與高效識別。TAS的工作原理主要包括兩個方面:聲波引起的FEP膜變形,膜的振動將聲信號主動轉化為電信號。
通過分析公式(1)、(2)和(3)和圖1可以清楚的知道影響TAS靈敏度的關鍵指標是電壓(U);通過調節參數楊氏模量(E)、半徑(r)和薄膜厚度(t)可以改變TAS的振動位移進而改變TAS的電壓輸出調節器件的靈敏度,另外這三個參數也可以調節TAS的諧振頻率(f0)。為了實現從噪聲環境中多方向的聲音識別和實時跟蹤聲源,作者引入了一種3D打印設計的SAS,具有均勻分布的五個表面腔,每個表面都集成了單個TAS。基于全向聲音識別和可調諧振頻率特性,SAS顯示了在嘈雜環境中拾取目標聲音的能力,這已經在自動駕駛HMI車輛中得到了證明。為了證明SAS的原理,模擬了不同聲源入射條件下TAS和SAS的位移響應。當聲源正對TAS時,該TAS具有的信號響應,當聲源在兩個TAS之間時,相鄰的兩個TAS具有相同的且的信號響應,基于這些特征,可以根據SAS的響應情況來判斷聲源的方位和角度。
四、總結與展望:
作者提出了一種自供電的SAS,該傳感器采用了的立方體設計,賦予了其全向聲音響應與精準跟蹤的雙重能力。通過結合低E的多孔振動膜,SAS具有高靈敏度(3172.9 mVppPa-1),寬頻率響應范圍(100-20,000 Hz)。利用SAS的全向聲音識別和跟蹤能力,以及其對不同聲源和方向的差異化諧振頻率響應,實現了從嘈雜背景中高效提取目標信號的目標。在深度學習的輔助下,SAS對目標信號的識別準確率平均達到了約98%。更重要的是,SAS的出現打破了多人同時與機器人互動的局限性。此外,SAS成功地展示了其在輔助會議系統、聲音跟蹤和自動駕駛系統(特別是在帶有背景音樂的環境中準確識別駕駛命令)中的表現。這項研究凸顯了自供電摩擦電技術在基于語音的人機界面系統中的深遠優勢。
來源:傳感器專家網,轉載此文是為傳遞更多信息,如有侵權請聯系刪除
請輸入賬號
請輸入密碼
請輸驗證碼
以上信息由企業自行提供,信息內容的真實性、準確性和合法性由相關企業負責,儀表網對此不承擔任何保證責任。
溫馨提示:為規避購買風險,建議您在購買產品前務必確認供應商資質及產品質量。