鬼佬大哥大
  • / 16
  • 下載費用:30 金幣  

一種立體視頻字幕檢測方法及使用該方法的系統.pdf

關 鍵 詞:
一種 立體 視頻 字幕 檢測 方法 使用 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201210208898.2

申請日:

2012.06.19

公開號:

CN102724384B

公開日:

2015.01.14

當前法律狀態:

有效性:

法律詳情: 授權|||實質審查的生效IPC(主分類):H04N 5/14申請日:20120619|||公開
IPC分類號: H04N5/14; H04N13/00; H04N13/04 主分類號: H04N5/14
申請人: 清華大學
發明人: 戴瓊海; 李龍弢; 王瑞平
地址: 100084 北京市海淀區100084-82信箱
優先權:
專利代理機構: 北京清亦華知識產權代理事務所(普通合伙) 11201 代理人: 張大威
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201210208898.2

授權公告號:

102724384B||||||

法律狀態公告日:

2015.01.14|||2012.12.05|||2012.10.10

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明提出了一種立體視頻字幕檢測方法及使用該方法的系統。該立體視頻字幕檢測系統包括延遲模塊、求邊緣模塊、求平均值模塊、確定字幕區域模塊和存儲單元陣列。該立體視頻字幕檢測方法包括:輸入視頻同步信號和視頻數據;提取視頻格式信息并確定字幕檢測窗格尺寸;對輸入視頻同步信號進行延遲處理;計算視頻數據邊緣的絕對值之和并對結果求取行平均值和列平均值;將平均值結果與閾值進行比較,確定列平均值對應的窗格是否屬于字幕區域。本發明采用可編程器件編程檢測字幕區域,具有體積小、成本低、高效快速的優點,這種應用于硬件的字幕區域檢測方法,能夠實時檢測出字幕,可以用于后續的字幕識別、提取視頻信息、改善立體轉換效果等方面。

權利要求書

權利要求書
1.  一種立體視頻字幕檢測方法,其特征在于,包括如下步驟:
S1:輸入視頻同步信號和視頻數據;
S2:從所述輸入視頻同步信號中提取視頻格式信息,根據所述視頻格式信息和視頻選擇模式確定字幕檢測窗格尺寸n×m,所述n為字幕檢測窗格的高度,所述m為字幕檢測窗格的長度;
S3:根據所述視頻格式信息和視頻選擇模式對輸入視頻同步信號進行延遲處理,輸出延遲視頻同步信號;
S4:根據視頻選擇模式,計算視頻數據X、Y方向的邊緣的絕對值之和;
S5:根據視頻選擇模式,對所述步驟S4的結果求取行平均值和列平均值;
S6:將所述步驟S5的結果與閾值進行比較,確定所述列平均值對應的窗格是否屬于字幕區域,輸出判斷結果。

2.  如權利要求1所述的立體視頻字幕檢測方法,其特征在于,所述視頻選擇模式為平面視頻、列交錯立體視頻或行交錯立體視頻之一。

3.  如權利要求1所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S2中,從所述輸入視頻同步信號中提取的視頻格式信息包括視頻數據行長、有效數據行長和視頻有效數據行數,如果有效數據行長<1040,則取字幕檢測窗格長m=16,如果有效數據行長≥1040,則取字幕檢測窗格長m=32;如果有效數據行數<640,則取字幕檢測窗格高n=16,如果有效數據行數≥640,則取字幕檢測窗格高n=32。

4.  如權利要求1所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S3中,對所述輸入視頻同步信號中的行同步信號延遲p周期;基于所述視頻格式信息,對輸入視頻同步信號中的幀同步信號重復n或n+1次延遲1行的操作,在此基礎上再延遲p周期;基于所述視頻格式信息,對所述輸入視頻同步信號中的使能信號重復n或n+1次延遲1行的操作,在此基礎上再延遲p周期,其中,p為最長路徑上的延遲周期。

5.  如權利要求1所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S4中,利用
sobel算子計算視頻數據X、Y方向的邊緣的絕對值之和。

6.  如權利要求1、2、5之一所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S4中,利用q1個p×K1bit的存儲單元組成的第一存儲單元陣列,sobel算子計算視頻數據X、Y方向的邊緣ax、ay的絕對值之和bij的公式為:
當選擇模式為普通平面視頻時,
ax=2(ai,j+1-ai,j-1)+(ai-1,j+1+ai+1,j+1-ai-1,j-1-ai+1,j-1)
ay=2(ai+1,j-ai-1,j)+(ai+1,j-1+ai+1,j+1-ai-1,j-1-ai-1,j+1)
當選擇模式為列交錯的立體視頻時,
ax=2(ai,j+2-ai,j-2)+(ai-1,j+2+ai+1,j+2-ai-1,j-2-ai+1,j-2)
ay=2(ai+1,j-ai-1,j)+(ai+1,j-2+ai+1,j+2-ai-1,j-2-ai-1,j+2)
當選擇模式為行交錯的立體視頻時,
ax=2(ai,j+1-ai,j-1)+(ai-2,j+1+ai+2,j+1-ai-2,j-1-ai+2,j-1)
ay=2(ai+2,j-ai-2,j)+(ai+2,j-1+ai+2,j+1-ai-2,j-1-ai-2,j+1)
視頻數據X、Y方向的邊緣的絕對值之和為:
bij=(|ax|+|ay|)/A,
其中,ai,j是0~255間的整數,表示視頻幀第i行第j列的灰度值,A是縮放比例,q1為行交錯下求sobel邊緣所需存取的數據數量,p為所處理視頻最大寬度,K1為計算結果的位數。

7.  如權利要求1所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S5中,利用q2個p×K1bit的存儲單元組成的第二存儲單元陣列,其中,q2為窗格最大高度,對步驟S4的結果求取行平均值和列平均值具體包括如下步驟:
S51:對步驟S4的結果中求取行平均值并存入存儲單元;
S52:對存儲單元中各行對應列的值求列平均值。

8.  如權利要求7所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S51中,對第
i行第j列的絕對值之和bij,其行平均值cij的求取公式為:當選擇模式為平面視頻或者行交錯立體視頻時,

當選擇模式為列交錯立體視頻時,

將行平均值cij存入i行j列視頻數據對應的存儲單元位置,
其中符號 表示小于等于x的最大整數。

9.  如權利要求7所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S52具體包括:對第i行第j列的行平均值cij,讀出存儲單元中前n-1行對應的第j列的行平均值ci-n+1,j~ci-1,j,求取列平均值dij,公式為:
當選擇模式為平面視頻或者行交錯立體視頻時,

當選擇模式為列交錯立體視頻時,

其中符號 表示小于等于x的最大整數。

10.  如權利要求1或2所述的立體視頻字幕檢測方法,其特征在于,在所述步驟S6中,利用q2個p×1bit的存儲單元組成的第三存儲單元陣列,所述步驟S6具體包括如下步驟:
S61:將步驟S5的結果dij與閾值進行比較,比較結果記為eij,如果dij大于閾值,則標記為字幕區域,eij=1,如果dij不大于閾值,則標記為非字幕區域,eij=0;
S62:讀出第三存儲單元陣列中前n-1行的第j列的值ei-n+1,j~ei-1,j,然后再將eij存入對應的第三存儲單元陣列中第i行第j列;
1 1 2 m
S63:對n個值ei-n+1,j~eij運算得到e,對e
分別延遲1~m-1個周期,得到e
~e,
所述e1的計算公式為:當選擇模式是平面視頻或列交錯立體視頻時,

當選擇模式是行交錯立體視頻時,

S64:對m個值e2~em運算得到所述的計算公式為:當選擇模式是平面視頻或行交錯立體視頻時,

當選擇模式是列交錯立體視頻時,

S65:輸出

11.  如權利要求1或10所述的立體視頻字幕檢測方法,其特征在于,所述閾值為上一幀的最大值的10/16。

12.  一種立體視頻字幕檢測系統,其特征在于,包括:延遲模塊、求邊緣模塊、求平均值模塊、確定字幕區域模塊和存儲單元陣列;
所述存儲單元陣列包括第一存儲單元陣列、第二存儲單元陣列和第三存儲單元陣列,所述第一存儲單元陣列與求邊緣模塊相連,所述第二存儲單元陣列與求平均值模塊相連,所述第三存儲單元陣列與確定字幕區域模塊相連;
所述延遲模塊接收輸入視頻同步信號,對所述輸入視頻同步信號進行延遲處理并輸出延遲視頻同步信號;
所述求邊緣模塊接收輸入視頻同步信號和視頻數據,利用第一存儲單元陣列計算視頻數據X、Y方向的邊緣的絕對值之和并將結果傳輸給求平均值模塊;
所述求平均值模塊利用第二存儲單元陣列對視頻數據X、Y方向的邊緣的絕對值之和求取行平均值和列平均值并將結果傳輸給確定字幕區域模塊;
所述確定字幕區域模塊利用第三存儲單元模塊確定該均值結果對應的窗格是否屬于字幕區域,輸出判斷結果。

說明書

說明書一種立體視頻字幕檢測方法及使用該方法的系統
技術領域
[0001] 本發明涉及視頻處理領域技術領域,特別涉及一種立體視頻字幕檢測方法及使用該方法的系統。
背景技術
[0002] 目前,全自動平面立體化轉換技術可以在不需要人工參與的條件下實時地將平面視頻轉換為立體視頻,可以滿足立體片源不足的問題。但是,由于一些立體視頻轉換算法或者系統在字幕區域會出現明顯的抖動,影響觀看效果。有一種字幕檢測方法是通過軟件檢測字幕,這種方法是針對軟件設計的算法,從實時視頻中檢測字幕區域較為困難,應用到硬件中需要較多的資源。由于硬件資源的限制,特別是硬件實時視頻與軟件視頻的區別,不能簡單地將軟件算法應用到硬件系統中。另一方面,可編程器件具有體積小、成本低、速度快、并行度高等優點,利用可編程器件編程檢測字幕區域,具有高效、快速的優點。因此,設計應用于硬件的字幕區域檢測方法和系統,實現實時字幕檢測是目前一個亟需解決的技術問題。
發明內容
[0003] 本發明旨在至少解決現有技術中存在的技術問題,特別創新地提出了一種立體視頻字幕檢測方法及使用該方法的系統。
[0004] 為了實現本發明的上述目的,根據本發明的一個方面,本發明提供了一種立體視頻字幕檢測方法,包括如下步驟:
[0005]S1:輸入視頻同步信號和視頻數據;
[0006]S2:從所述輸入視頻同步信號中提取視頻格式信息,根據所述視頻格式信息和視頻選擇模式確定字幕檢測窗格尺寸n×m,所述n為字幕檢測窗格的高度,所述m為字幕檢測窗格的長度;
[0007] S3:根據所述視頻格式信息和視頻選擇模式對輸入視頻同步信號進行延遲處理,輸出延遲視頻同步信號;
[0008]S4:根據視頻選擇模式,計算視頻數據X、Y方向的邊緣的絕對值之和;
[0009]S5:根據視頻選擇模式,對所述步驟S4的結果求取行平均值和列平均值;
[0010] S6:將所述步驟S5的結果與閾值進行比較,確定所述列平均值對應的窗格是否屬于字幕區域,輸出判斷結果。
[0011]本發明采用可編程器件編程檢測字幕區域,具有體積小、成本低、高效快速的優點,這種應用于硬件的字幕區域檢測方法,能夠實時檢測出字幕,可以用于后續的字幕識別、提取視頻信息、改善立體轉換效果等方面。
[0012]為了實現本發明的上述目的,根據本發明的另一個方面,本發明提供了一種立體視頻字幕檢測系統,其包括:延遲模塊、求邊緣模塊、求平均值模塊、確定字幕區域模塊和存儲單元陣列;所述存儲單元陣列包括第一存儲單元陣列、第二存儲單元陣列和第三存儲單
元陣列,所述第一存儲單元陣列與求邊緣模塊相連,所述第二存儲單元陣列與求平均值模塊相連,所述第三存儲單元陣列與確定字幕區域模塊相連;所述延遲模塊接收輸入視頻同步信號,對所述輸入視頻同步信號進行延遲處理并輸出延遲視頻同步信號;所述求邊緣模塊接收輸入視頻同步信號和視頻數據,利用第一存儲單元陣列計算視頻數據X、Y方向的邊緣的絕對值之和并將結果傳輸給求平均值模塊;所述求平均值模塊利用第二存儲單元陣列對視頻數據X、Y方向的邊緣的絕對值之和求取行平均值和列平均值并將結果傳輸給確定字幕區域模塊;所述確定字幕區域模塊利用第三存儲單元模塊確定該均值結果對應的窗格是否屬于字幕區域,輸出判斷結果。
[0013]本發明的立體視頻字幕檢測系統采用可編程器件編程檢測字幕區域,具有體積小、成本低、高效快速的優點。
[0014]本發明的附加方面和優點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發明的實踐了解到。
附圖說明
[0015]本發明的上述和/或附加的方面和優點從結合下面附圖對實施例的描述中將變得明顯和容易理解,其中:
[0016]圖1是本發明一種優選實施方式中立體視頻字幕檢測系統的結構圖;
[0017]圖2是本發明一種優選實施方式中使能信號DEN的視頻數據行長和有效數據行長的關系圖;
[0018]圖3是本發明一種優選實施方式中延遲視頻同步信號xt的實現圖;
[0019]圖4是本發明視頻數據的行平均值求取工作流程圖;
[0020]圖5是本發明第二存儲單元陣列的讀寫操作時序圖;
[0021]圖6是本發明對n行對應列的行平均值求取列平均值的工作流程圖。
具體實施方式
[0022]下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發明,而不能理解為對本發明的限制。
[0023] 在本發明的描述中,需要理解的是,術語“縱向”、“橫向”、“上”、“下”、“前”、“后”、“左”、“右”、“豎直”、“水平”、“頂”、“底”“內”、“外”等指示的方位或位置關系為基于附圖所示的方位或位置關系,僅是為了便于描述本發明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構造和操作,因此不能理解為對本發明的限制。
[0024] 在本發明的描述中,除非另有規定和限定,需要說明的是,術語“安裝”、“相連”、“連接”應做廣義理解,例如,可以是機械連接或電連接,也可以是兩個元件內部的連通,可以是直接相連,也可以通過中間媒介間接相連,對于本領域的普通技術人員而言,可以根據具體情況理解上述術語的具體含義。
[0025]圖1是本發明一種優選實施方式中立體視頻字幕檢測系統的結構圖,從圖中可見,該立體視頻字幕檢測系統包括延遲模塊、求邊緣模塊、求平均值模塊、確定字幕區域模
塊和存儲單元陣列,該存儲單元陣列包括第一存儲單元陣列、第二存儲單元陣列和第三存儲單元陣列,該第一存儲單元陣列與求邊緣模塊相連,該第二存儲單元陣列與求平均值模塊相連,該第三存儲單元陣列與確定字幕區域模塊相連。延遲模塊接收輸入視頻同步信號,對該輸入視頻同步信號進行延遲處理并輸出延遲視頻同步信號;求邊緣模塊接收輸入視頻同步信號和視頻數據,利用第一存儲單元陣列計算視頻數據X、Y方向的邊緣的絕對值之和并將絕對值之和傳輸給求平均值模塊;求平均值模塊利用第二存儲單元陣列對視頻數據X、Y方向的邊緣的絕對值之和求取行平均值和列平均值并將結果傳輸給確定字幕區域模塊;確定字幕區域模塊利用第三存儲單元模塊確定該均值結果對應的窗格是否屬于字幕區域,輸出判斷結果。
[0026] 本發明的立體視頻字幕檢測系統采用可編程器件編程檢測字幕區域,具有體積小、成本低、高效快速的優點。
[0027]從圖1中可見,該立體視頻字幕檢測系統對立體視頻字幕進行檢測時,求平均值模塊還與輸入視頻同步信號和延遲視頻同步信號相連,確定字幕區域模塊還與延遲視頻同步信號相連。
[0028] 本發明還提供了一種立體視頻字幕檢測方法,該立體視頻字幕檢測方法能夠應用于本發明的立體視頻字幕檢測系統上,該立體視頻字幕檢測方法包括如下步驟:
[0029]S1:輸入視頻同步信號和視頻數據;
[0030]S2:從輸入視頻同步信號中提取視頻格式信息,根據視頻格式信息和視頻選擇模式確定字幕檢測窗格尺寸n×m,其中,n為字幕檢測窗格的高度,m為字幕檢測窗格的長度;[0031]S3:根據視頻格式信息和視頻選擇模式對輸入視頻同步信號進行延遲處理,輸出延遲視頻同步信號;
[0032]S4:根據視頻選擇模式,計算視頻數據X、Y方向的邊緣的絕對值之和;
[0033]S5:根據視頻選擇模式,對步驟S4的結果求取行平均值和列平均值;
[0034] S6:將步驟S5的結果與閾值進行比較,確定列平均值對應的窗格是否屬于字幕區域,輸出判斷結果。
[0035] 在本發明的一種優選實施方式中,該立體視頻字幕檢測方法的步驟具體為:[0036] 第一步,輸入視頻同步信號和視頻數據,在本實施方式中,該視頻同步信號x0包括使能信號DEN、行同步信號HSYNC和幀同步信號VSYNC。
[0037]第二步,從輸入視頻同步信號中提取視頻格式信息,根據視頻格式信息和視頻選擇模式確定字幕檢測窗格尺寸n×m,其中,n為字幕檢測窗格的高度,m為字幕檢測窗格的長度。在本實施方式中,所提取的視頻格式信息包括視頻數據行長、有效數據行長和視頻有效數據行數;視頻選擇模式為平面視頻、列交錯立體視頻或行交錯立體視頻之一。
[0038] 圖2是使能信號DEN的視頻數據行長和有效數據行長的關系圖,結合圖2所示,在本實施方式中,提取視頻數據行長、有效數據行長信息的方法包括:在使能信號DEN有效
(即DEN值為1)時累加并在使能信號DEN無效(即DEN值為0)時更新有效數據行長并將計數器歸零,這樣就可以提取出有效數據行長信息。對使能信號DEN的兩個上升沿時間間隔進行計數,若在兩上升沿之間幀同步信號VSYNC沒有跳變,則在使能信號DEN上升沿處更新視頻數據行長并將計數器歸零;若在兩上升沿之間幀同步信號VSYNC信號有跳變,則只將計數器歸零,這樣就可以提取出視頻數據行長信息。在幀同步信號VSYNC的下降沿處更新
視頻有效數據行數,將計數器歸零,然后開始對使能信號DEN上升沿進行計數,這樣就可以提取出視頻有效數據行數信息。
[0039]在本實施方式中,如果有效數據行長<1040,則取字幕檢測窗格長m=16,如果有效數據行長≥1040,則取字幕檢測窗格長m=32;如果有效數據行數<640,則取字幕檢測窗格高n=16,如果有效數據行數≥640,則取字幕檢測窗格高n=32。
[0040] 第三步,根據獲取的視頻格式信息和視頻選擇模式對輸入視頻同步信號進行延遲處理,并輸出延遲視頻同步信號。在本實施方式中,對輸入視頻同步信號中的行同步信號HSYNC延遲p周期。基于視頻格式信息,對視頻同步信號中的幀同步信號VSYNC重復n或n+1次延遲1行的操作,然后在此基礎上再延遲p周期,具體是當選擇模式為普通平面視頻或列交錯立體視頻時,幀同步信號VSYNC重復n次延遲1行的操作,當選擇模式為行交錯立體視頻時,幀同步信號VSYNC重復n+1次延遲1行的操作。基于視頻格式信息,對視頻同步信號中的使能信號DEN重復n或n+1次延遲1行的操作,在此基礎上再延遲p周期,具體是當選擇模式為普通平面視頻或列交錯立體視頻時,使能信號DEN重復n次延遲1行的操作,當選擇模式為行交錯立體視頻時,使能信號DEN重復n+1次延遲1行的操作。在這一步驟中p為最長路徑上的延遲周期。具體的實現圖如圖3所示,從圖中可見,對于行同步信號HSYNC,可以直接延遲p周期。對于使能信號DEN,需要從DEN信號中提取視頻數據行長、有效數據行長兩個信息,對使能信號DEN延遲n行或n+1行,在此基礎上再延遲p周期,其中,延遲n行或n+1行可以通過串聯n個或n+1個延遲1行的操作實現,即將延遲1行的操作重復n次或n+1次。使能信號DEN延遲1行的具體方法是:在使能信號DEN上升沿處開始計數,當計數值達到有效數據行長時,將延遲信號DEN_DELAY的值設為有效(即1)并繼續計數,當計數值達到視頻數據行長時,將延遲信號DEN_DELAY的值設為無效(即0)并繼續計數。對于幀同步信號VSYNC,需要從使能信號DEN信號中提取視頻數據行長信息,對幀同步信號VSYNC延遲n行或n+1行,在此基礎上再延遲p周期,延遲n行或n+1行可以通過串聯
n個或n+1個延遲1行的操作實現,幀同步信號VSYNC延遲1行的具體方法是:在幀同步信號VSYNC跳變處記下幀同步信號VSYNC跳變前后狀態并開始計數,當計數值達到視頻數據行長時,根據幀同步信號VSYNC跳變前后狀態對延遲信號VSYNC_DELAY產生相同的跳變,并停止計數。
[0041] 第四步,根據視頻選擇模式計算視頻數據X、Y方向的邊緣的絕對值之和,在本實施方式中,利用sobel算子計算視頻數據X、Y方向的邊緣的絕對值之和。在這個過程中,需要利用個p×K1bit的存儲單元組成的第一存儲單元陣列,利用sobel算子計算視頻數據X、Y方向的邊緣ax、ay的絕對值之和bij的公式為:
[0042]當選擇模式為普通平面視頻時,
[0043]ax=2(ai,j+1-ai,j-1)+(ai-1,j+1+ai+1,j+1-ai-1,j-1-ai+1,j-1)[0044]ay=2(ai+1,j-ai-1,j)+(ai+1,j-1+ai+1,j+1-ai-1,j-1-ai-1,j+1)[0045]當選擇模式為列交錯的立體視頻時,
[0046]ax=2(ai,j+2-ai,j-2)+(ai-1,j+2+ai+1,j+2-ai-1,j-2-ai+1,j-2)[0047]ay=2(ai+1,j-ai-1,j)+(ai+1,j-2+ai+1,j+2-ai-1,j-2-ai-1,j+2)[0048]當選擇模式為行交錯的立體視頻時,
[0049]ax=2(ai,j+1-ai,j-1)+(ai-2,j+1+ai+2,j+1-ai-2,j-1-ai+2,j-1)
[0050]ay=2(ai+2,j-ai-2,j)+(ai+2,j-1+ai+2,j+1-ai-2,j-1-ai-2,j+1)
[0051]視頻數據X、Y方向的邊緣的絕對值之和為:bij=(|ax|+|ay|)/A,
[0052]其中,ai,j是0~255間的證書,表示視頻幀第i行第j列的灰度值,A是縮放比例,用于限制最后結果的位數,q1為行交錯下求sobel邊緣所需存取的數據數量,p為所處理視頻最大寬度,K1為計算結果的位數。在本實施方式中,A的取值為4,q1的取值為4,視頻最大寬度p取為2880,K1為9。
[0053]在本實施方式中,計算式中減法計算的具體過程為:減數轉換為補碼,然后再與被減數進行補碼的加法運算,乘法除法轉換為移位運算的和,對于圖像邊沿的點,超出圖像的區域填充為0。
[0054]第五步,根據視頻選擇模式,對視頻數據X、Y方向的邊緣的絕對值之和求取行平均值和列平均值,在計算過程中需要利用q2個p×K1bit的存儲單元組成的第二存儲單元陣列,其中,q2為窗格最大高度,在本實施方式中,窗格最大高度q2取值為31,計算過程具體包括如下步驟:
[0055] 首先,對視頻數據X、Y方向的邊緣的絕對值之和求取行平均值并存入存儲單元,對于第i行第j列的絕對值之和bij,其行平均值cij的求取公式為:
[0056]當選擇模式為平面視頻或者行交錯立體視頻時,
[0057]

[0058]當選擇模式為列交錯立體視頻時,
[0059]

[0060]將行平均值cij存入i行j列視頻數據對應的存儲單元位置,
[0061]其中符號表示小于等于x的最大整數。
[0062] 然后,對存儲單元中各行對應列的值求列平均值,對于第i行第j列的行平均值cij,讀出存儲單元中前n-1行對應的第j列的行平均值ci-n+1,j~ci-1,j,求取列平均值dij,公式為:
[0063]當選擇模式為平面視頻或者行交錯立體視頻時,
[0064]

[0065]當選擇模式為列交錯立體視頻時,
[0066]

[0067]其中符號表示小于等于x的最大整數。

[0068] 圖4是視頻數據的行平均值求取工作流程圖,根據窗格長度m的值及選擇模式確定輸出的值。當m=16,選擇模式為列交錯立體視頻時,行平均值cij為:
[0069]

[0070]當m=16,選擇模式為平面視頻或行交錯立體視頻時,行平均值cij為:
[0071]

[0072]當m=32,選擇模式為列交錯立體視頻時,行平均值cij為:
[0073]

[0074]當m=32,選擇模式為平面視頻或行交錯立體視頻時,行平均值cij為:
[0075]

[0076]圖5是第二存儲陣列的讀寫操作時序圖,從圖中可見,31個存儲單元的讀寫操作信號用一個31bit的變量WREN表示,在幀同步信號VSYNC的下降沿置為1,此后在每個行同步信號HSYNC的上升沿從低位向高位循環移位。31個存儲單元的讀地址在行同步信號HSYNC的跳變沿或者值等于有效數據行長時置為0,此后在每個時鐘累加。31個存儲單元的讀寫地址是完全一致的,且寫地址相對落后于讀地址。
[0077]圖6是對n行對應列的行平均值求取列平均值的工作流程圖,從圖中可見,當
n=16,選擇模式為平面視頻或者行交錯立體視頻時,列平均值dij為:
[0078]

[0079]當n=16,選擇模式為列交錯立體視頻時,列平均值dij為:
[0080]

[0081]當n=32,選擇模式為平面視頻或者行交錯立體視頻時,列平均值dij為:
[0082]

[0083]當n=32,選擇模式為列交錯立體視頻時,列平均值dij為:
[0084]

[0085]第六步,將列平均值dij與閾值比較,確定該均值結果對應的窗格是否屬于字幕區域,并輸出判斷結果。在本實施方式中,取閾值為上一幀的最大值的10/16。該步驟中需要利用q2個p×1bit的存儲單元組成的第三存儲單元陣列,其中,q2為窗格最大高度,在本實施方式中,窗格最大高度q2取值為31,具體包括如下步驟:
[0086]首先:將列平均值dij與閾值進行比較,比較結果記為eij,如果dij大于閾值,則標記為字幕區域,eij=1,如果dij不大于閾值,則標記為非字幕區域,eij=0;
[0087]然后:讀出第三存儲單元陣列中前n-1行的第j列的值ei-n+1,j~ei-1,j,然后再將
eij存入對應的第三存儲單元陣列中第i行第j列;
[0088] 再后:對n個值e ~e運算得到e1,對e1
em,e1的計算公式為:
分別延遲1~m-1個周期,得到e2~
[0089]當選擇模式是平面視頻或列交錯立體視頻時,
[0090]
[0091]當選擇模式是行交錯立體視頻時,
[0092]
[0093]再后:對m個值e2~em運算得到的計算公式為:
[0094]當選擇模式是平面視頻或行交錯立體視頻時,
[0095]
[0096]當選擇模式是列交錯立體視頻時,
[0097] [0098] 最后:輸出
[0099] 在本實施方式中,對第三存儲單元陣列的操作與對第二存儲單元陣列的的操作相同,在此不作贅述。
[0100]本發明采用可編程器件編程檢測字幕區域,具有體積小、成本低、高效快速的優點,這種應用于硬件的字幕區域檢測方法,能夠實時檢測出字幕,可以用于后續的字幕識別、提取視頻信息、改善立體轉換效果等方面。
[0101]在本說明書的描述中,參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發明的至少一個實施例或示例中。在本說明書中,對上述術語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結構、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結合。
[0102] 盡管已經示出和描述了本發明的實施例,本領域的普通技術人員可以理解:在不脫離本發明的原理和宗旨的情況下可以對這些實施例進行多種變化、修改、替換和變型,本
發明的范圍由權利要求及其等同物限定。

關于本文
本文標題:一種立體視頻字幕檢測方法及使用該方法的系統.pdf
鏈接地址:http://www.wwszu.club/p-6420967.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大