鬼佬大哥大
  • / 6
  • 下載費用:30 金幣  

一種基于光流分析的漢字圖像查找方法.pdf

摘要
申請專利號:

CN201510422929.8

申請日:

2015.07.17

公開號:

CN105069026A

公開日:

2015.11.18

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20150717|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 北京航空航天大學
發明人: 齊越; 左慶; 徐澤祥; 儲備; 周博生; 胡勇
地址: 100191北京市海淀區學院路37號
優先權:
專利代理機構: 北京科迪生專利代理有限責任公司11251 代理人: 楊學明; 顧煒
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510422929.8

授權公告號:

||||||

法律狀態公告日:

2019.03.08|||2015.12.16|||2015.11.18

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明公開了一種基于光流分析的漢字圖像查找方法。該方法中的漢字數據庫直接用圖像存儲,查找時用戶輸入的也是漢字圖像。用戶輸入待查找圖像之后,先利用光流分析將輸入圖像與漢字圖像庫中的每張圖像進行對齊,然后度量兩者之間的距離。查找結果選取距離最小的若干個圖像。

權利要求書

1.一種基于光流分析的漢字圖像查找方法,其特征在于包括以下步驟:
(1)漢字圖像的預處理與數據庫構造;
(2)輸入圖像的預處理;
(3)光流分析進行對齊;
(4)度量圖像距離與返回結果。
2.如權利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述步
驟(1),具體采用如下方法:
對每張漢字圖像,裁剪補齊為正方形,然后使用濾波算法去除部分噪聲,然后縮小到預
定大小作為查找時的鍵值。
3.如權利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述步
驟(2),輸入圖像的預處理與權利要求2中相同。
4.如權利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述步
驟(3),構造了的光流模型中的數據項能量采用了L1范數,而平滑項能量采用了L2范數。
5.如權利要求1中所述的一種基于光流分析的漢字圖像查找方法,其特征在于:所述步
驟(4),度量距離使用了逐像素相減的絕對值之和的方式。

說明書

一種基于光流分析的漢字圖像查找方法

技術領域

本發明屬于計算機視覺與圖像處理領域,具體地說是光流分析與圖像查找方法,該方法
可將用戶輸入的漢字圖像,利用光流分析與庫中的漢字圖像盡可能地對齊,然后度量輸入圖
像與庫中圖像的距離,選取若干最近距離的圖像作為輸出結果。

背景技術

隨著中國國力的逐步提升,漢字文物古跡越來越受到重視,利用數字圖像采集技術,大
量的漢字碑文圖像被存儲到數據庫中。在進行漢字圖像的查找、修復等方面工作也逐一展開。
傳統的漢字查找方式是通過一些古文專家進行人工識別并以標簽的形式對每個漢字圖像進
行存儲,查找的時候也是以查找標簽的方式來搜索數據庫,這需要大量的人工參與。而且人
工標記的方式容易受到主觀判斷的影響。

發明內容

本發明提出了一種基于光流分析的漢字圖像查找方法。主要內部包含四個步驟:漢字圖
像的預處理與數據庫構造;輸入圖像的預處理;利用光流分析進行圖像對齊;度量對齊之后
的圖像的距離并選取距離最小的若干圖像作為返回結果。

附圖說明

圖1漢字圖像的預處理。

具體實施方式

本發明的基于光流分析的漢字圖像查找技術采用如下步驟:

(1)漢字圖像的預處理與數據庫構造。每個漢字從碑文等古跡圖像中分割出來,用二
值化圖像表示(黑底白字),對非正方形的圖像補上黑色邊框形成正方形,由于圖像可能存
在著噪點,需要對圖像進行一定的濾波(比如中值濾波、形態學變形),然后將圖像縮小到
32x32的小圖像作為每個原始圖像的鍵值,鍵值用于查找時的圖像匹配。

(2)輸入圖像的預處理。本發明允許用戶輸入漢字和輸入漢字圖像兩種方式進行查找。
如果用戶輸入漢字,則先將輸入的漢字用字體庫(比如隸書字體)轉換到漢字圖像,這種方
式得到的圖像可以直接縮放到32x32作為鍵值。而對于直接輸入漢字圖像的查找方式,也需
要進行預處理,處理過程參照步驟(1)。

(3)光流分析進行對齊。我們采用的光流分析模型如下:

E(u,v)=Edata(u,v)+α2Esm(u,v)(1)

式中(u,v)為待求的光流場,u為水平位移分量,v為豎直位移分量,單位為像素,Edata
為數據匹配項能量,Esm為平滑性能量,α為加權系數。其中:

Edata(u,v)=∫Ω||I1(x,y)-I2(x+u,y+v)||1dΩ(2)

E s m ( u , v ) = Ω | | u | | 2 2 + | | v | | 2 2 d Ω , ]]>

I1,I2分別為兩個匹配的圖像,Ω為積分空間,(x,y)為空間坐標,數據匹配能量
項我們使用的是一范數,這是考慮到數據庫中的漢字圖像會有噪聲,使用一范數時更加有效。

求解此光流模型時,我們首先構造圖像金字塔,進行由粗到細地求解,金字塔構造3級
分別為8x8,16x16,32x32.最初的光流場初始化為0,當低分辨率的光流場求解完成之后,
將光流場上采樣到高一層次分辨率作為初值進行求解。而每個層次分辨率的求解過程如下:

(a)使用公式代替公式(2)中的一范數。

(b)公式(1)的歐拉-拉格朗日方程(也就是最優解滿足的方程)為:

Ψ ( I t 2 ) · I t I x = α 2 Δ u - - - ( 3 ) ]]>

Ψ ( I t 2 ) · I t I y = α 2 Δ v - - - ( 4 ) ]]>

其中:

I x = x I 2 ( x + u , y + v ) ]]>

I y = y I 2 ( x + u , y + v ) ]]>

It=I2(x+u,y+v)-I1(x,y)

由于公式(3)(4)是非線性的,我們采用兩層的穩定點迭代方法來求解;

外層穩定點迭代為:

Ψ ( ( I t k + 1 ) 2 ) · I t k + 1 I x k = α 2 Δu k + 1 - - - ( 5 ) ]]>

Ψ ( ( I t k + 1 ) 2 ) · I t k + 1 I y k = α 2 Δv k + 1 - - - ( 6 ) ]]>

對進行一階泰勒展開:

I t k + 1 I t k + I x k du k + I y k dv k , ]]>

其中uk+1=uk+duk,vk+1=vk+dvk變量由(uk+1,vk+1)變為(duk,dvk),

相應的公式(5),(6)變為:

Ψ ( ( I t k + I x k du k + I t k dv k ) 2 ) · ( I t k I x k + I x k I x k du k + I x k I y k dv k ) = α 2 ( Δu k + Δdu k ) - - - ( 7 ) ]]>

Ψ ( ( I t k + I x k du k + I t k dv k ) 2 ) · ( I t k I y k + I x k I y k du k + I y k I y k dv k ) = α 2 ( Δv k + Δdv k ) - - - ( 8 ) ]]>

然后進行內層穩定點迭代:

Ψ ( ( I t k + I x k du k , l + I t k dv k , l ) 2 ) · ( I t k I x k + I x k I x k du k , l + 1 + I x k I y k dv k , l + 1 ) = α 2 ( Δu k + Δdu k , l + 1 ) ]]>

Ψ ( ( I t k + I x k du k , l + I t k dv k , l ) 2 ) · ( I t k I y k + I x k I y k du k , l + 1 + I y k I y k dv k , l + 1 ) = α 2 ( Δv k + Δdv k , l + 1 ) ]]>

(4)度量圖像的距離與返回結果。步驟(3)中求出光流場(u,v)之后,將圖像I2對
齊到圖像I1然后度量距離,距離定義為:

D(I1,I2)=∫Ω||I1(x,y)-I2(x+u,y+v)||1dΩ。

關 鍵 詞:
一種 基于 分析 漢字 圖像 查找 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于光流分析的漢字圖像查找方法.pdf
鏈接地址:http://www.wwszu.club/p-6385953.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大