本站小編為你精心準備了多通道連續頭傳輸函數的測量參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《天津大學學報》2015年第S1期
頭相關傳輸函數(head-relatedtransferfunction,HRTF)描述了在自由場下,空間一點到人雙耳的傳輸過程.HRTF包含有人耳對空間方位感知的重要信息,在沉浸式語音交互中有廣泛的應用.然而許多應用都需要高空間方位密度的HRTF數據,其測量過程十分麻煩,對實驗條件和受試人員都有十分苛刻的要求.而采用傳統的實驗室測量方法來獲得高密度HRTF,是一件十分費時、復雜的事情.若利用計算方法獲得高密度HRTF,也需要很長的計算時間.因此研究高密度的HRTF測量方法十分必要.當人工頭連續轉動時,其內耳處的麥克風接收到揚聲器的播放信號,然后采用在線解卷雙耳信號的方法來獲取當前方位的HRTF,這樣就可以獲得高密度的HRTF.這里的解卷雙耳信號,可以看成是對HRTF的一個逼近過程,這樣就可以采用廣義頻域自適應濾波的方法進行高密度HRTF的測量.本文在一個建立好的HRTF數據庫的基礎上對廣義頻域的方法進行了性能驗證,其中利用時變卷積得到了雙耳信號,同時加入了麥克風噪聲和測量噪聲以求真實仿真,并且對不同的噪聲級別和不同的轉速做了誤差評價。
1高密度HRTF測量
通常,HRTF可以通過聲學測量[1]和數值計算得到[2-3].然而由于HRTF是連續函數且隨方位和人耳的生理結構變化,直接采用測量方法獲取高密度HRTF成為一件極其耗時、復雜的工作.一種獲取高密度HRTF的方法是采用插值方法.該方法假設HRTF函數是空間光滑的,那么空間任意方位的HRTF可以由相鄰方位的HRTF插值得到.采用這種方法時,原始HRTF數據的空間采樣數據必須小于5°以避免空間混疊[6],同時插值前必須去除HRTF的初始延遲.然而利用這種方法在仿真運動聲源時[1],難免會引入人工誤差.最近,一些文章提出了關于連續HRTF測量的方法[7-9].測量中,受試者坐于1個連續旋轉平臺,耳朵插入入耳式麥克風.1個或者多個揚聲器播放激勵信號(如最長序列(maximumlengthsequence,MLS)信號、掃頻(sweep)信號),然后1個在線系統辨識方法(如歸一化最小均方(normalizedleastmeansquare,NLMS))處理接收到的雙耳信號,從而估計出HRTF,以此在連續轉動下獲取高密度HRTF.一些文中已表明在高密度HRTF測量中,采用自適應濾波技術可得到較為理想的結果.在自適應濾波技術[10]中,通常NLMS的收斂速度較慢.因此,對于在一定速度旋轉下的連續HRTF測量,NLMS很難收斂到一個穩定的理想結果.相比于NLMS方法,遞推最小二乘(recursiveleastsquare,RLS)法在收斂性能上有明顯的提高,但巨大的計算量是其缺點,限制了其在解決在線問題上的應用.廣義多通道頻域自適應濾波[11](generalizedmultichannelfrequency-domainadaptivefiltering,GMFDAF)方法,是一種基于RLS的新型自適應濾波器技術,其在快速、準確系統辨識問題上擁有出色的性能.前期的研究工作表明[12],GMFDAF在單通道高密度HRTF測量中性能出色,具有收斂速度快、計算誤差小的優點,本文將其推廣至多通道高密度HRTF測量問題.首先,通過仿真實驗來獲取雙耳接收到的信號,然后用GMFDAF在線解卷雙耳信號的方法來獲取當前方位的HRTF,這樣就可以獲得高密度的HRTF.
2基于自適應濾波器的高密度HRTF測量系統
測量時,受試者坐于連續轉臺上,且內耳處置有入耳式麥克風,用于拾取聲音.受試者頭部固定有頭動方位傳感器,并將揚聲器固放于受試者一定距離處,正對受試者頭部中心.在HRTF測量中,計算機產生MLS信號x(n)送于揚聲器用于播放.
2.1GMFDAF方法GMFDAF算法是基于RLS準則的頻域算法,通過遞歸計算和快速傅里葉變換(fastFouriertransfor-mation,FFT)可大大減少計算量.
2.2性能評價為了評價算法在時域和頻域的性能,分別定義時域失配準則函數和頻域失配準則函數,以衡量算法逼近效果.時域失配準則函數定義。
2.3HRTF數據庫及實驗條件實驗中采用基于邊界元方法計算得到的中國人工頭BHead210,HRTF數據庫[3].該數據庫包含俯仰角−90°~90°的1°分辨力和方位角0°~360°的1°分辨力HRTF數據.實驗中,仿真受試者頭部連續轉動。
3廣義多通道頻域算法下的連續HRTF測量
3.1不同聲道下性能比較表1顯示了在不同通道下,GMFDAF與NLMS方法的比較結果.為詳細比較這2個方法的收斂性能,根據人耳的頻域特性,指定評價指標為低頻段最大誤差和高頻段最大誤差.實驗分別從兩通道、三通道、四通道、五通道4種情況比較了它們在兩種自適應方法下得到的結果誤差.其中兩通道表示仰角為-30°和30°分別放置揚聲器,在轉臺連續轉動下,順時針旋轉1周,雙耳內置麥克風拾取揚聲器播放信號.在得到麥克風信號后,采用GMFDAF和NLMS分別實時解卷揚聲器信號和麥克風信號,從而估計當前方位的HRTF.在不同通道的性能比較中,設置的轉動速度為10°/s.產生揚聲器信號所采用的HRIR加入信噪比為30,dB的白噪聲,用來模擬HRIR測量時位置等因素的不確定性.同時麥克風所接收的信號加入信噪比為40,dB的白噪聲,用來模擬環境噪聲和麥克風位置不準確性帶來的影響.為了更多地反映2種方法在連續HRTF測量中的不同點,采用了平均失配率、最大失配率、低頻最大誤差和高頻最大誤差4個評價指標.其中,平均失配率表示在旋轉1周的過程中,待估計的HRTF和實際的HRTF的失配率的平均情況.這個指標從相對能量的角度顯示了算法在估計的過程中失配殘差與原始HRTF的能量比.最大失配率表示在旋轉過程中失配率的最差情況.前2個指標是為了從客觀的角度來評價算法的好壞.但是對于HRTF,頻域的變化對方位感知也十分重要.謝菠蓀研究發現,對于2次測量得到的HRTF來說,它們的低頻誤差和高頻誤差只有在一定的范圍內,這樣的測量才算正確,即不影響人耳判斷空間方位.為了從頻域的角度考慮算法的性能,第3個指標為低頻最大誤差,表明在6,kHz以下,在旋轉1周的過程中,所得到的最大誤差.同理,高頻最大誤差表明在6~16,kHz范圍,旋轉1周的過程中,所得到的最大誤差.從表中可以看出,在兩通道(-30°,30°)的比較中,GMFDAF方法的平均失配率比NLMS方法的平均失配率低5.057,7,dB.在通道增加之后,GMFDAF方法的平均失配率相對NLMS方法的平均失配率有所下降,如三通道相對差值為5.625,6,dB,四通道為5.662,7,dB.這表明從平均失配的角度來講,GMFDAF方法要優于NLMS方法.從各自方法的平均失配率來比較,GMFDAF方法在平均失配率上,從兩通道增到三通道下降了2.707,2,dB,再從三通道增到四通道下降了2.099,3,dB.而NLMS方法在平均失配率上,從兩通道增到三通道下降了3.275,1,dB,再從三通道增到四通道下降了2.136,4,dB.這表明在通道數增加的情況下,GMFDAF方法在性能下降上比NLMS方法慢.在最大失配率的比較上,兩通道的GMFDAF方法比NLMS低5.982,6,dB,三通道時低6.071,9,dB,四通道時低5.034,3,dB.同樣在兩、三、四通道時這2種方法在低頻和高頻最大誤差的比較中,GMFDAF方法的低頻結果分別比NLMS方法低2.458,3,dB、2.409,0,dB和1.690,1,dB,高頻分別低2.530,5,dB、2.644,9,dB和2.970,0,dB.這些指標均顯示GMFDAF方法要優于NLMS方法.
3.2不同HRIR信噪比下性能比較以兩通道為代表,考慮不同HRIR噪聲下2種方法的比較.之所以加入HRIR噪聲在于HRTF的定義為自由場下的傳輸函數.而實際測量往往在消聲室中進行,這樣會導致實測HRTF受到房間內反射、散射以及房間體積和溫度的影響.為使仿真更為真實,加入了HRIR噪聲,以仿真這些系統本身存在的誤差影響.通常消聲室內的反射和散射都比較微弱,同時房間的體積和溫度影響一般也較小,這時考慮不同噪聲情況下2種方法的比較.表2顯示了轉速10°/s、麥克風信噪比40,dB情況下,GMFDAF方法和NLMS方法的比較結果.實驗中,HRIR信噪比從20,dB增大到40,dB,分別比較了2種算法的平均失配率、最大失配率、低頻最大誤差和高頻最大誤差.在HRIR信噪比為20,dB的時候,GMFDAF方法和NLMS方法的平均失配率相差不大,這說明如果在實際測量中環境條件比較差的情況下,2種方法性能相當.平均失配率的比較中,在HRIR信噪比增大到30,dB時,二者相差5.057,7,dB,增大到40,dB時,二者相差7.173,7,dB,表明在較好的實際測量條件下,GMFDAF方法會得到更好的測量結果.在最大失配率的比較上,與平均失配率比較的結果相似.在不同HRIR信噪比的條件下,低頻最大誤差和高頻最大誤差也是隨著噪聲的降低而降低.但是較NLMS方法來說,GMFDAF方法下降得更為迅速.不過當HRIR信噪比從30,dB增大到40,dB時,所有指標的下降趨于放緩,表明系統噪聲在一定級別之下時,對結果的影響程度逐漸減弱.
3.3不同麥克風信噪比下性能比較本實驗主要考察在不同麥克風信噪比下,二者方法性能的比較.加入麥克風噪聲用于仿真2個影響因素,一是環境噪聲,二是揚聲器和麥克風的位置噪聲.前者很好理解,就是仿真測量環境中存在的一些背景噪聲,比如電腦、風扇等的噪聲,這些噪聲通常均為白噪聲.后者則是仿真揚聲器和麥克風位置偏差引起的噪聲,這種噪聲一般也是白噪聲.表3中顯示了不同麥克風信噪比下,NLMS方法和GMFDAF方法的比較結果.實驗條件是:兩通道,轉速為10°/s,HRIR信噪比為30,dB,麥克風信噪比從20,dB增大到50,dB.在麥克風信噪比為20,dB時,NLMS方法在平均失配率上略優于GMFDAF方法,這是因為GMFDAF方法是基于RLS方法的,這使得GMFDAF方法存在RLS方法的缺點(如不穩定).雖然采用頻域的算法可以去除時域的相關性,但是由于麥克風噪聲過大,在一定程度上影響了方法的性能.當麥克風噪聲繼續減小時,GMFDAF方法平均失配率迅速提升,而NLMS方法的提升效果卻較慢.但同時,當麥克風信噪比從40,dB增大到50,dB時,2種方法的結果提升均較慢,這意味著此時麥克風噪聲對方法性能的影響變?。溈孙L噪聲影響最大的指標是最大失配率.從表3中可以看出,在麥克風信噪比為20,dB時,GMFDAF方法最大失配率結果高于NLMS方法3.355,4,dB.在信噪比為30,dB時,GMFDAF方法最大失配率結果低于NLMS方法0.168,2,dB.在麥克風信噪比分別為30,dB和40,dB時,在最大失配率的對比上,GMFDAF方法結果分別低于NLMS方法5.982,6,dB和6.612,4,dB,相比麥克風信噪比20、30,dB的結果有顯著提升.從二者的低頻最大誤差和高頻最大誤差來看,麥克風噪聲降低可使GMFDAF方法的結果有較為明顯提升,而對于NLMS方法的提升卻較?。趯嶋H的測量環境中,可通過隔聲吸聲等手段盡量降低環境噪聲,這就使得GMFDAF方法更適合連續HRTF的測量.
3.4不同轉速下性能比較GMFDAF方法相比于NLMS方法的最大優點之一,就在于其快速的收斂性能.采用自適應濾波算法進行連續HRTF的測量,對算法的收斂性能有著極高的要求.這個實驗用以比較不同轉速下,2種方法的性能差異.實驗條件設置為兩通道,HRIR信噪比30,dB,麥克風信噪比40,dB,轉速選取了3~30°/s內的5種速度.從表4中可以看出,在轉速為3°/s時,GMFDAF方法和NLMS方法的性能相當,因為此時轉動速度較低,HRTF變化較慢,算法的跟蹤性能都較好.然后當速度增大到5°/s時,GMFDAF方法性能指標只有較小下降變化,而NLMS方法的性能指標卻下降明顯.之后,當轉速增大到10°/s時,對于二者平均失配率來講,GMFDAF方法只下降了1.723,5,dB,而NLMS方法卻下降了4.802,1,dB.從表4中還可以看出,當轉速進一步增大時,對比各項性能指標,GMFDAF方法的結果相比于NLMS方法的變化更加緩慢.在實際的HRTF測量中,采用自適應濾波方法獲取HRIR時,需要轉速更快的方法來減小測量時間,同時保證同樣的測聽效果.通過兩種方法的轉速對比結果,說明GMFDAF方法更適合做連續HRTF的測量.
4結語
在獲取高密度HRTF時,傳統方法十分費時.本文利用GMFDAF方法來測量連續HRTF,對實驗的條件設置作了詳細的描述,并通過仿真方法與NLMS方法進行了對比.在對比實驗中,對不同的通道數、不同的系統噪聲、不同的麥克風噪聲和不同的轉速下,進行了2種方法的性能對比.平均失配率、最大失配率、低頻最大誤差、高頻最大誤差4個評價指標的實驗結果顯示GMFDAF方法要優于NLMS方法.
作者:付中華 林武雄 周少麗 任鵬鈺 單位:西北工業大學計算機學院