鬼佬大哥大
  • / 41
  • 下載費用:30 金幣  

一種消除混響的方法、裝置和設備.pdf

摘要
申請專利號:

CN201410160159.X

申請日:

2014.04.21

公開號:

CN103956170A

公開日:

2014.07.30

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G10L 21/02申請日:20140421|||公開
IPC分類號: G10L21/02(2013.01)I 主分類號: G10L21/02
申請人: 華為技術有限公司
發明人: 詹五洲; 鄔鑫鋒
地址: 518129 廣東省深圳市龍崗區坂田華為總部辦公樓
優先權:
專利代理機構: 北京中博世達專利商標代理有限公司 11274 代理人: 王亞沛
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201410160159.X

授權公告號:

||||||

法律狀態公告日:

2016.12.07|||2014.08.27|||2014.07.30

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明實施例提供了一種消除混響的方法、裝置和設備,能夠準確消除語音信號中的混響信號。該方法包括:獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的能量,第1幀至第L-1幀的純凈語音信號的混響能量系數和第L幀的語音信號能量的系數,以及第i個語音輸入設備的第1幀至第L-1幀的純凈語音信號的能量;對所述第i個語音輸入設備的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數進行更新;估算第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響能量;獲得所述第L幀信號的純凈語音信號的能量。該方法適用于音頻技術領域。

權利要求書

權利要求書
1.  一種消除混響的方法,其特征在于,該方法包括:
獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數,以及第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續L幀語音信號為頻域信號,所述L大于1;
根據所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數進行更新;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的能量,和所述第i個語音輸入設備的更新后的第1幀至第L-1幀的純凈語音信號的混響能量系數,估算所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響能量;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第L幀信號的能量和所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。

2.  根據權利要求1所述的方法,其特征在于,所述獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數具體包括:
根據預設的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數g1、g2…gL-1以及第L幀的語音信號能量的系數gL,其中,所述第一公式為:
其中,1<=l<=L。

3.  根據權利要求1或2所述的方法,其特征在于,所述L為混響時間T與幀的預設時間長度的比值取整,其中,所述混響時間T為根據所述預設的沖激信號的能量衰減曲線的斜率q,估計的所述沖激信號的能量衰減至預設能量的時間。

4.  根據權利要求1-3任一項所述的方法,其特征在于,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數進行更新具體包括:
根據第二公式獲得第i個語音輸入設備和第j個語音輸入設備的連續L幀信號的能量的差,其中,所述第二公式為:
其中,當1<=l<=L-1時,所述gj,lEi,l為第j個語音輸入設備的第l幀的純凈語音信號的混響能量系數與第i個語音輸入設備的第l幀的信號能量的卷積,所述gi,lEj,l為第i個語音輸入設備的第l幀的純凈語音信號的混響能量系數與第j個語音輸入設備的第l幀的信號能量的卷積,當l=L時,所述gj,lEi,l為第j個語音輸入設備的第L幀的語音信號能量的系數與第i個語音輸入設備的第L幀的信號能量的卷積,所述gi,lEj,l為第i個語音輸入設備的第L幀的語音信號能量的系數與第j個語音輸入設備的第L幀的信號能量的卷積;
根據所述第二公式獲得所述第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差;
根據所述第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差,獲得三公式,所述第三公式為:
其中,當1<=l<=L-1時,所述為第i個語音輸入設備第l幀純凈語音信號的混響能量系數的更新值,所述gi,l為第i個語音輸入設備第l幀純凈語音信號的混響能量系數,所述μl為預設置的第l幀的更新系數,所述h(ei,El)為根據第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差,以及其他M-1個語音輸入設備的連續L幀語音信號的第1幀至第L幀的語音信號的能量得到的值;
根據所述第三公式,獲得所述第i個語音輸入設備的所述連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數的更新值。

5.  根據權利要求4所述的方法,其特征在于,所述μl>=μl-1,其中,所述μl為預設置的第l幀的更新系數,所述μl-1為預設置的第l-1幀的更新系數,所述第l-1幀是第l幀的前一幀,所述1<=l-1。

6.  一種消除混響的方法,其特征在于,該方法包括:
獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數,以及第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,其中,所述語音信號包含純凈語音信號和混響信號,所述連續L幀語音信號為頻域信號,所述L大于1;
根據所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數進行更新;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,和所述第i個語音輸入設備的更新后的第1幀至第L-1幀的純凈語音信號的混響幅度系數,估算所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響幅度;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第L幀信號的幅度和所述混響幅度,獲得所述第L幀信號的純凈語音信號的幅度。

7.  一種消除混響的裝置,其特征在于,該裝置包括:第一獲得單元,第一更新單元,第一估算單元和第二獲得單元;
所述第一獲得單元,用于獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數,以及第i個語音輸入設備輸入的連續L幀語音信號的 第1幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續L幀語音信號為頻域信號,所述L大于1;
所述第一更新單元,用于根據所述第一獲得單元發送的所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數進行更新;
所述第一估算單元,用于根據所述第一獲得單元發送的所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的能量,和所述第一更新單元發送的所述第i個語音輸入設備的更新后的第1幀至第L-1幀的純凈語音信號的混響能量系數,估算所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響能量;
所述第二獲得單元,用于根據所述第一獲得單元發送的所述第i個語音輸入設備輸入的連續L幀語音信號的第L幀信號的能量和所述第一估算單元發送的所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。

8.  根據權利要求7所述的裝置,其特征在于,所述第一獲得單元具體用于:
根據預設的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數g1、g2…gL-1以及第L幀的語音信號能量的系數gL,其中,所述第一公式為:
其中,1<=l<=L。

9.  根據權利要求7或8所述的裝置,其特征在于,所述L為混響時間T與幀的預設時間長度的比值取整,其中,所述混響時間T為根據所述預設的沖激信號的能量衰減曲線的斜率q,估計的所述沖激信號的能量衰減至預設能量的時間。

10.  根據權利要求7-9任一項所述的裝置,其特征在于,所述第一更新單元具體用于:
根據第二公式獲得第i個語音輸入設備和第j個語音輸入設備的連續L幀信號的能量的差,其中,所述第二公式為:
其中,當1<=l<=L-1時,所述gj,lEi,l為第j個語音輸入設備的第l幀的純凈語音信號的混響能量系數與第i個語音輸入設備的第l幀的信號能量的卷積,所述gi,lEj,l為第i個語音輸入設備的第l幀的純凈語音信號的混響能量系數與第j個語音輸入設備的第l幀的信號能量的卷積,當l=L時,所述gj,lEi,l為第j個語音輸入設備的第L幀的語音信號能量的系數與第i個語音輸入設備的第L幀的信號能量的卷積,所述gi,lEj,l為第i個語音輸入設備的第L幀的語音信號能量的系數與第j個語音輸入設備的第L幀的信號能量的卷積;
根據所述第二公式獲得所述第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差;
根據所述第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差,獲得三公式,所述第三公式為:
其中,當1<=l<=L-1時,所述為第i個語音輸入設備第l幀純凈語音信號的混響能量系數的更新值,所述gi,l為第i個語音輸入設備第l幀純凈語音信號的混響能量系數,所述μl為預設置的第l幀的更新系數,所述h(ei,El)為根據第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差,以及其他M-1個語音輸入設備的連續L幀語音信號的第1幀至第L幀的語音信號的能量得到的值;
根據所述第三公式,獲得所述第i個語音輸入設備的所述連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數的更新值。

11.  根據權利要求10所述的裝置,其特征在于,所述μl>=μl-1,其中,所述μl為預設置的第l幀的更新系數,所述μl-1為預設置的第l-1幀的更新系數,所述第l-1幀是第l幀的前一幀,所述1<=l-1。

12.  一種消除混響的裝置,其特征在于,該裝置包括:第三獲得單元,第二更新單元,第二估算單元和第四獲得單元:
所述第三獲得單元,用于獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈 語音信號幅度的系數,以及第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,其中,所述語音信號包含純凈語音信號和混響信號,所述連續L幀語音信號為頻域信號,所述L大于1;
所述第二更新單元,用于根據所述第三獲得單元發送的所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數進行更新;
所述第二估算單元,用于根據所述第三獲得單元發送的所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,和所述第二更新單元發送的所述第i個語音輸入設備的更新后的第1幀至第L-1幀的純凈語音信號的混響幅度系數,估算所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響幅度;
所述第四獲得單元,用于根據所述第三獲得單元發送的所述第i個語音輸入設備輸入的連續L幀語音信號的第L幀信號的幅度和所述第二估算單元發送的所述混響幅度,獲得所述第L幀信號的純凈語音信號的幅度。

13.  一種消除混響的設備,其特征在于,該設備包括:第一收發器和第一處理器;
所述第一收發器用于:接收第i個語音輸入設備以及其他M-1個語音輸入設備輸入的連續L幀語音信號;
所述第一處理器用于:獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數,以及第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的能量,其中,所述語音信號包含純凈語音信號和混響信號,所述連續L幀語音信號為頻域信號,所述L大于1;
根據所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語 音信號的第1幀至第L幀的語音信號的能量,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數進行更新;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的能量,和所述第i個語音輸入設備的更新后的第1幀至第L-1幀的純凈語音信號的混響能量系數,估算所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響能量;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第L幀信號的能量和所述混響能量,獲得所述第L幀信號的純凈語音信號的能量。

14.  根據權利要求13所述的設備,其特征在于,所述第一處理器具體用于:
根據預設的沖激信號的能量衰減曲線的斜率q,通過第一公式,獲得所述i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數g1、g2…gL-1以及第L幀的語音信號能量的系數gL,其中,所述第一公式為:
其中,1<=l<=L。

15.  根據權利要求13或14所述的設備,其特征在于,所述L為混響時間T與幀的預設時間長度的比值取整,其中,所述混響時間T為根據所述預設的沖激信號的能量衰減曲線的斜率q,估計的所述沖激信號的能量衰減至預設能量的時間。

16.  根據權利要求13-15任一項所述的設備,其特征在于,所述第一處理器具體用于:
根據第二公式獲得第i個語音輸入設備和第j個語音輸入設備的連續L幀信號的能量的差,其中,所述第二公式為:
其中,當1<=l<=L-1時,所述gj,lEi,l為第j個語音輸入設備的第l幀的純凈語音信號的混響能量系數與第i個語音 輸入設備的第l幀的信號能量的卷積,所述gi,lEj,l為第i個語音輸入設備的第l幀的純凈語音信號的混響能量系數與第j個語音輸入設備的第l幀的信號能量的卷積,當l=L時,所述gj,lEi,l為第j個語音輸入設備的第L幀的語音信號能量的系數與第i個語音輸入設備的第L幀的信號能量的卷積,所述gi,lEj,l為第i個語音輸入設備的第L幀的語音信號能量的系數與第j個語音輸入設備的第L幀的信號能量的卷積;
根據所述第二公式獲得所述第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差;
根據所述第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差,獲得三公式,所述第三公式為:
其中,當1<=l<=L-1時,所述為第i個語音輸入設備第l幀純凈語音信號的混響能量系數的更新值,所述gi,l為第i個語音輸入設備第l幀純凈語音信號的混響能量系數,所述μl為預設置的第l幀的更新系數,所述h(ei,El)為根據第i個語音輸入設備和其他M-1個語音輸入設備兩兩之間的連續L幀信號的能量的差,以及其他M-1個語音輸入設備的連續L幀語音信號的第1幀至第L幀的語音信號的能量得到的值;
根據所述第三公式,獲得所述第i個語音輸入設備的所述連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響能量系數以及第L幀的語音信號能量的系數的更新值。

17.  根據權利要求16所述的設備,其特征在于,所述μl>=μl-1,其中,所述μl為預設置的第l幀的更新系數,所述μl-1為預設置的第l-1幀的更新系數,所述第l-1幀是第l幀的前一幀,所述1<=l-1。

18.  一種消除混響的設備,其特征在于,該設備包括:第二收發器和第二處理器;
所述第二收發器用于:接收第i個語音輸入設備以及其他M-1個語音輸入設備輸入的連續L幀語音信號;
所述第二處理器用于:獲取第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數,以及第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,其中,所述語音信號包含純凈語音信號和混響信號,所述連續L幀語音信號為頻域信號,所述L 大于1;
根據所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L幀的語音信號的幅度,和所述第i個以及其他M-1個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數,對所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的混響幅度系數以及第L幀的純凈語音信號幅度的系數進行更新;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號的幅度,和所述第i個語音輸入設備的更新后的第1幀至第L-1幀的純凈語音信號的混響幅度系數,估算所述第i個語音輸入設備輸入的連續L幀語音信號的第1幀至第L-1幀的純凈語音信號對所述第L幀語音信號產生的混響信號的混響幅度;
根據所述第i個語音輸入設備輸入的連續L幀語音信號的第L幀信號的幅度和所述混響幅度,獲得所述第L幀信號的純凈語音信號的幅度。

關 鍵 詞:
一種 消除 混響 方法 裝置 設備
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種消除混響的方法、裝置和設備.pdf
鏈接地址:http://www.wwszu.club/p-6140583.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大