鬼佬大哥大
  • / 16
  • 下載費用:30 金幣  

一種文件索引的建立方法及系統.pdf

摘要
申請專利號:

CN201510379389.X

申請日:

2015.07.01

公開號:

CN104899337A

公開日:

2015.09.09

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20150701|||公開
IPC分類號: G06F17/30; G06F9/44 主分類號: G06F17/30
申請人: 中國農業銀行股份有限公司
發明人: 沈樂; 商曉媛; 王瑞琦; 劉媛媛; 張一; 劉丹; 肖建輝; 韓金
地址: 100005北京市東城區建國門內大街69號
優先權:
專利代理機構: 北京集佳知識產權代理有限公司11227 代理人: 王寶筠
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510379389.X

授權公告號:

||||||

法律狀態公告日:

2018.05.29|||2015.10.07|||2015.09.09

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本申請公開了一種文件索引的建立方法及系統,接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。這樣,在文件編寫過程中即可根據文件名稱以及文件的格式信息建立多維度XML索引文件,在文件使用的過程中,只需要查詢XML索引文件就可以知道所需信息是否存在、定位所需信息所在的具體位置以及信息間的相關性,能夠使檢索的過程得到簡化,并可以準確檢索到有效信息。

權利要求書

權利要求書
1.  一種文件索引的建立方法,其特征在于,包括:
接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;
根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;
通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。

2.  根據權利要求1所述的方法,其特征在于,所述根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相應的文件解析器,包括:
獲得所述文件名稱,根據所述命名規范查找與所述文件名稱相對應的文件解析器,判斷是否查找到與所述文件名稱相對應的文件解析器;
如果未查找到與所述文件名稱相對應的文件解析器,根據所述文件系統的配置信息判斷所述文件系統中是否允許保存非規范文件;
如果所述文件系統中不允許保存非規范文件,輸出無法找到文件解析器的提示信息,并保存到錯誤記錄中。

3.  根據權利要求2所述的方法,其特征在于,還包括:
如果所述文件系統中允許保存非規范文件,輸出無法找到文件解析器的提示信息,并判斷是否將所述文件作為非規范文件保存;
如果將所述文件作為非規范文件保存,則將所述文件作為非規范文件添加到XML索引文件中;
如果不將所述文件作為非規范文件保存,則保存到錯誤記錄中。

4.  根據權利要求1所述的方法,其特征在于,所述通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中,包括:
清除所述XML索引文件中與所述文件相關的索引節點;
檢查所述文件的格式信息,判斷所述格式信息是否正確;
如果所述格式信息不正確,將保存到錯誤記錄中,并輸出無法解析所述文件的提示信息;
如果所述格式信息正確,獲取所述文件中全部的根節點;
在所述XML索引文件中查找與所述根節點對應的節點;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點,則在所述XML索引文件中建立虛節點,并保存到錯誤記錄中;
如果在所述XML索引文件中查找到與所述根節點對應的節點,則在所述XML索引文件中查找與所述根節點對應的節點下的所有子節點;
如果在所述XML索引文件中查找到與所述根節點對應的節點下的子節點,則將索引信息與子節點的關系逐一添加到所述XML索引文件中;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點下的子節點,判斷所述文件系統的配置信息是否允許添加子節點;
如果允許,則添加子節點,檢查所述XML索引文件中是否包括與添加的子節點相關的虛節點,如果有,則將與添加的子節點相關的虛節點變為實際的節點并在錯誤記錄中清除相關的錯誤記錄;
如果不允許,則添加相關的虛節點,并保存到錯誤記錄中。

5.  根據權利要求4所述的方法,其特征在于,還包括:
判斷所述文件系統的配置信息是否有完整性檢查要求;
如果有完整性檢查要求,則進行完整性檢查,并將檢查出的錯誤保存到錯誤記錄中;
生成錯誤列表,所述錯誤列表中包括所有的錯誤記錄,并保存所述XML索引文件。

6.  一種文件索引的建立系統,其特征在于,包括:
編寫模塊,用于接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;
查找模塊,用于根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;
解析模塊,用于通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。

7.  根據權利要求6所述的系統,其特征在于,所述查找模塊,包括:
查找單元,用于獲得所述文件名稱,根據所述命名規范查找與所述文件 名稱相對應的文件解析器,判斷是否查找到與所述文件名稱相對應的文件解析器;
判斷單元,用于如果未查找到與所述文件名稱相對應的文件解析器,根據所述文件系統的配置信息判斷所述文件系統中是否允許保存非規范文件;
第一輸出單元,用于如果所述文件系統中不允許保存非規范文件,輸出無法找到文件解析器的提示信息,并保存到錯誤記錄中。

8.  根據權利要求7所述的系統,其特征在于,所述查找模塊,還包括:
第二輸出單元,用于如果所述文件系統中允許保存非規范文件,輸出無法找到文件解析器的提示信息,并判斷是否將所述文件作為非規范文件保存;
添加單元,用于如果將所述文件作為非規范文件保存,則將所述文件作為非規范文件添加到XML索引文件中;
保存單元,用于如果不將所述文件作為非規范文件保存,則保存到錯誤記錄中。

9.  根據權利要求6所述的系統,其特征在于,
所述解析模塊,具體用于:
清除所述XML索引文件中與所述文件相關的索引節點;
檢查所述文件的格式信息,判斷所述格式信息是否正確;
如果所述格式信息不正確,將保存到錯誤記錄中,并輸出無法解析所述文件的提示信息;
如果所述格式信息正確,獲取所述文件中全部的根節點;
在所述XML索引文件中查找與所述根節點對應的節點;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點,則在所述XML索引文件中建立虛節點,并保存到錯誤記錄中;
如果在所述XML索引文件中查找到與所述根節點對應的節點,則在所述XML索引文件中查找與所述根節點對應的節點下的所有子節點;
如果在所述XML索引文件中查找到與所述根節點對應的節點下的子節點,則將索引信息與子節點的關系逐一添加到所述XML索引文件中;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點下的子節點,判斷所述文件系統的配置信息是否允許添加子節點;
如果允許,則添加子節點,檢查所述XML索引文件中是否包括與添加的子節點相關的虛節點,如果有,則將與添加的子節點相關的虛節點變為實際的節點并在錯誤記錄中清除相關的錯誤記錄;
如果不允許,則添加相關的虛節點,并保存到錯誤記錄中。

10.  根據權利要求9所述的系統,其特征在于,
所述解析模塊,還用于:
判斷所述文件系統的配置信息是否有完整性檢查要求;
如果有完整性檢查要求,則進行完整性檢查,并將檢查出的錯誤保存到錯誤記錄中;
生成錯誤列表,所述錯誤列表中包括所有的錯誤記錄,并保存所述XML索引文件。

說明書

說明書一種文件索引的建立方法及系統
技術領域
本申請涉及軟件編譯技術領域,特別是涉及一種文件索引的建立方法及系統。
背景技術
在大型軟件開發項目中,根據軟件工程的要求會在開發過程中產生大量的需求、設計、程序代碼、測試代碼等信息。這些信息一般都以文件的形式保存在文件系統中,可以通過檢索特定的文件獲取所需要的信息。文件系統是一個簡單的樹形存儲結構,只能提供一維基于命名規范的索引,而且無法確認所需的信息是否在特定的文件中,為了獲取所需要的信息,就需要建立有效的索引。
在實際工作中,需要對文件進行多種不同緯度的檢索并準確定位所需信息所在的位置,而目前的電子化辦公環境中充斥著基于不同格式和模板的海量文件,面對海量的文件,如何能夠準確檢索到所需要的文件并定位到文件中所需要的內容,成為日常工作中無法回避的問題。
現有技術中,在文件建立階段,建立者是根據命名規范將文件保存在文件系統的指定目錄中,文件全路徑是文件的唯一索引,文件所在的目錄代表文件的分類,文件名隱含文件應該包含的內容,文件名的后綴代表文件的類型,在文件使用階段,可以通過命名規范進行精確檢索,也可以通過全文檢索進行模糊查詢。
但是,基于命名規范的精確檢索只能建立基于文件全路徑的單一樹狀索引,僅僅能表述基于某一緯度的分類關系,文件名只能表述有限分類信息,而無法表述文件內更多的信息。全文檢索只能進行關鍵字進行檢索,在大多數情況下關鍵字并不能代表一段有效的信息,所以當通過全文檢索進行查找的時候,往往需要面對大量無用的信息。
可見,這兩種現有的檢索方法由于缺少適合的文件索引,所能檢索的信 息有限,會造成檢索的過程繁瑣,卻難以準確檢索到有效信息。
發明內容
有鑒于此,本申請實施例提供一種文件索引的建立方法及系統,用于建立一種文件索引,能夠使檢索的過程得到簡化,并可以準確檢索到有效信息。
為了實現上述目的,本申請實施例提供的技術方案如下:
一種文件索引的建立方法,包括:
接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;
根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;
通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。
優選地,所述根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相應的文件解析器,包括:
獲得所述文件名稱,根據所述命名規范查找與所述文件名稱相對應的文件解析器,判斷是否查找到與所述文件名稱相對應的文件解析器;
如果未查找到與所述文件名稱相對應的文件解析器,根據所述文件系統的配置信息判斷所述文件系統中是否允許保存非規范文件;
如果所述文件系統中不允許保存非規范文件,輸出無法找到文件解析器的提示信息,并保存到錯誤記錄中。
優選地,還包括:
如果所述文件系統中允許保存非規范文件,輸出無法找到文件解析器的提示信息,并判斷是否將所述文件作為非規范文件保存;
如果將所述文件作為非規范文件保存,則將所述文件作為非規范文件添加到XML索引文件中;
如果不將所述文件作為非規范文件保存,則保存到錯誤記錄中。
優選地,所述通過查找的解析器從所述文件的格式信息中解析關鍵字, 并根據預設規則將所述關鍵字添加到XML索引文件中,包括:
清除所述XML索引文件中與所述文件相關的索引節點;
檢查所述文件的格式信息,判斷所述格式信息是否正確;
如果所述格式信息不正確,將保存到錯誤記錄中,并輸出無法解析所述文件的提示信息;
如果所述格式信息正確,獲取所述文件中全部的根節點;
在所述XML索引文件中查找與所述根節點對應的節點;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點,則在所述XML索引文件中建立虛節點,并保存到錯誤記錄中;
如果在所述XML索引文件中查找到與所述根節點對應的節點,則在所述XML索引文件中查找與所述根節點對應的節點下的所有子節點;
如果在所述XML索引文件中查找到與所述根節點對應的節點下的子節點,則將索引信息與子節點的關系逐一添加到所述XML索引文件中;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點下的子節點,判斷所述文件系統的配置信息是否允許添加子節點;
如果允許,則添加子節點,檢查所述XML索引文件中是否包括與添加的子節點相關的虛節點,如果有,則將與添加的子節點相關的虛節點變為實際的節點并在錯誤記錄中清除相關的錯誤記錄;
如果不允許,則添加相關的虛節點,并保存到錯誤記錄中。
優選地,還包括:
判斷所述文件系統的配置信息是否有完整性檢查要求;
如果有完整性檢查要求,則進行完整性檢查,并將檢查出的錯誤保存到錯誤記錄中;
生成錯誤列表,所述錯誤列表中包括所有的錯誤記錄,并保存所述XML索引文件。
一種文件索引的建立系統,包括:
編寫模塊,用于接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;
查找模塊,用于根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;
解析模塊,用于通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。
優選地,所述查找模塊,包括:
查找單元,用于獲得所述文件名稱,根據所述命名規范查找與所述文件名稱相對應的文件解析器,判斷是否查找到與所述文件名稱相對應的文件解析器;
判斷單元,用于如果未查找到與所述文件名稱相對應的文件解析器,根據所述文件系統的配置信息判斷所述文件系統中是否允許保存非規范文件;
第一輸出單元,用于如果所述文件系統中不允許保存非規范文件,輸出無法找到文件解析器的提示信息,并保存到錯誤記錄中。
優選地,所述查找模塊,還包括:
第二輸出單元,用于如果所述文件系統中允許保存非規范文件,輸出無法找到文件解析器的提示信息,并判斷是否將所述文件作為非規范文件保存;
添加單元,用于如果將所述文件作為非規范文件保存,則將所述文件作為非規范文件添加到XML索引文件中;
保存單元,用于如果不將所述文件作為非規范文件保存,則保存到錯誤記錄中。
優選地,所述解析模塊,具體用于:
清除所述XML索引文件中與所述文件相關的索引節點;
檢查所述文件的格式信息,判斷所述格式信息是否正確;
如果所述格式信息不正確,將保存到錯誤記錄中,并輸出無法解析所述文件的提示信息;
如果所述格式信息正確,獲取所述文件中全部的根節點;
在所述XML索引文件中查找與所述根節點對應的節點;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點,則在所述XML索引文件中建立虛節點,并保存到錯誤記錄中;
如果在所述XML索引文件中查找到與所述根節點對應的節點,則在所述 XML索引文件中查找與所述根節點對應的節點下的所有子節點;
如果在所述XML索引文件中查找到與所述根節點對應的節點下的子節點,則將索引信息與子節點的關系逐一添加到所述XML索引文件中;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點下的子節點,判斷所述文件系統的配置信息是否允許添加子節點;
如果允許,則添加子節點,檢查所述XML索引文件中是否包括與添加的子節點相關的虛節點,如果有,則將與添加的子節點相關的虛節點變為實際的節點并在錯誤記錄中清除相關的錯誤記錄;
如果不允許,則添加相關的虛節點,并保存到錯誤記錄中。
優選地,所述解析模塊,還用于:
判斷所述文件系統的配置信息是否有完整性檢查要求;
如果有完整性檢查要求,則進行完整性檢查,并將檢查出的錯誤保存到錯誤記錄中;
生成錯誤列表,所述錯誤列表中包括所有的錯誤記錄,并保存所述XML索引文件。
應用本申請的文件索引的建立方法及系統,接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。這樣,在文件編寫過程中即可根據文件名稱以及文件的格式信息建立多維度XML索引文件,在文件使用的過程中,只需要查詢XML索引文件就可以知道所需信息是否存在、定位所需信息所在的具體位置以及信息間的相關性,能夠使檢索的過程得到簡化,并可以準確檢索到有效信息。
附圖說明
為了更清楚地說明本申請實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領域普通技術人員 來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1為本申請實施例提供的一種文件索引的建立方法的流程圖;
圖2為本申請實施例提供的另一種文件索引的建立方法的流程圖;
圖3為本申請實施例提供的一種文件索引的建立系統的結構示意圖。
具體實施方式
相關術語解釋:
格式化文件:用于存儲與特定表相關的數據文件中各字段格式信息的文件稱為“格式化文件”。格式化文件提供了大容量導出或大容量導入數據所需的全部格式信息。格式化文件為編寫數據文件提供了一個靈活的系統,用戶只需進行極少的編輯甚至無需編輯即可編寫出符合其他數據格式的數據文件,或從其他軟件讀取數據文件。
文件系統:文件系統是操作系統用于明確磁盤或分區上的文件的方法和數據結構;即在磁盤上組織文件的方法。也指用于存儲文件的磁盤或分區,或文件系統種類。操作系統中負責管理和存儲文件信息的軟件機構稱為文件管理系統,簡稱文件系統。文件系統由三部分組成:與文件管理有關軟件、被管理文件以及實施文件管理所需數據結構。從系統角度來看,文件系統是對文件存儲器空間進行組織和分配,負責文件存儲并對存入的文件進行保護和檢索的系統。具體地說,它負責為用戶建立文件,存入、讀出、修改、轉儲文件,控制文件的存取,當用戶不再使用時撤銷文件等。
全文檢索:全文檢索是一種將文件中所有文本與檢索項匹配的文字資料檢索方法。全文檢索系統是按照全文檢索理論建立起來的用于提供全文檢索服務的軟件系統。
XML:XML(Extensible Markup Language,可擴展標記語言)是一套定義語法標記的規則,這些標記將文檔分成許多部件并對這些部件加以標識。它也是元標記語言,即定義了用于定義其他與特定領域有關的、語義的和結構化的標記語言的句法語言,它在軟件開發領域占據著不可或缺的重要地位。
為了使本技術領域的人員更好地理解本申請中的技術方案,下面將結合 本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本申請保護的范圍。
為了使本技術領域的人員更好地理解本申請方案,使本申請的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖和具體實施方式對本申請作進一步詳細的說明。
圖1為本申請實施例提供的一種文件索引的建立方法的流程圖。
參照圖1所示,本申請實施例提供的文件索引的建立方法,包括:
步驟S11:接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;
在本申請實施例中,文件建立者和使用者必須遵循相同的基于文件模板的文件編制要求和文件命名規范等預設的格式信息。文件建立者根據預設的格式信息,按照特定的文件模板編寫文件,并按照預設的命名規范保存文件。
步驟S12:根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;
在本申請實施例中,文件解析器是用于根據特定規則解析受管理文件的程序,主要由兩部分組成:根據文件類型,調用相應API打開文件數據流程序;根據規則編寫的解析文件內容的程序。安裝在文件系統上的偵聽器獲得文件的變化,根據命名規范在配置中查找適用的文件解析器。
圖2為本申請實施例提供的另一種文件索引的建立方法的流程圖,根據圖2所示,在本申請實施例中,所述根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相應的文件解析器,包括:
步驟S121:獲得所述文件名稱,根據所述命名規范查找與所述文件名稱相對應的文件解析器,判斷是否查找到與所述文件名稱相對應的文件解析器;
步驟S122:如果未查找到與所述文件名稱相對應的文件解析器,根據所述文件系統的配置信息判斷所述文件系統中是否允許保存非規范文件;
步驟S123:如果所述文件系統中不允許保存非規范文件,輸出無法找到 文件解析器的提示信息,并保存到錯誤記錄中。
可以理解的是,還包括:
步驟S124:如果所述文件系統中允許保存非規范文件,輸出無法找到文件解析器的提示信息,并判斷是否將所述文件作為非規范文件保存;
步驟S125:如果將所述文件作為非規范文件保存,則將所述文件作為非規范文件添加到XML索引文件中;
步驟S126:如果不將所述文件作為非規范文件保存,則保存到錯誤記錄中。
本申請實施例提供的技術方案,在實際執行中,根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相應的文件解析器,具體為:獲得發生變化的文件名;根據基于命名規范的配置獲取文件解析器,如果獲得文件解析器,進入文件解析流程;如果未獲得文件解析器,根據配置檢查是否允許保存非規范文件;如果允許保存,提示文件建立者無法找到此文件的解析器,是否作為非規范文件保存;如果選擇是,則將文件作為非規范文件添加到XML索引文件中;如果選擇否,則將文件作為錯誤保存到錯誤記錄中;如果不允許保存,提示文件建立者無法找到此文件的解析器,并將文件作為錯誤保存到錯誤記錄中。
步驟S13:通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。
在本申請實施例中,所述通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中,包括:清除所述XML索引文件中與所述文件相關的索引節點;檢查所述文件的格式信息,判斷所述格式信息是否正確;如果所述格式信息不正確,將保存到錯誤記錄中,并輸出無法解析所述文件的提示信息;如果所述格式信息正確,獲取所述文件中全部的根節點;在所述XML索引文件中查找與所述根節點對應的節點;如果在所述XML索引文件中無法查找到與所述根節點對應的節點,則在所述XML索引文件中建立虛節點,并保存到錯誤記錄中;如果在所述XML索引文件中查找到與所述根節點對應的節點,則在所述XML索引文件中查找與所述根節點對應的節點下的所有子節點;如果在所述XML索引文件 中查找到與所述根節點對應的節點下的子節點,則將索引信息與子節點的關系逐一添加到所述XML索引文件中;如果在所述XML索引文件中無法查找到與所述根節點對應的節點下的子節點,判斷所述文件系統的配置信息是否允許添加子節點;如果允許,則添加子節點,檢查所述XML索引文件中是否包括與添加的子節點相關的虛節點,如果有,則將與添加的子節點相關的虛節點變為實際的節點并在錯誤記錄中清除相關的錯誤記錄;如果不允許,則添加相關的虛節點,并保存到錯誤記錄中。
在實際執行中,通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中,具體為:
清除XML文件中所有與此文件相關的索引節點;
檢查文件格式;
如果文件格式不正確,直接將錯誤保存到錯誤記錄中并提示文件建立者文件不規范無法解析;
如果文件格式正確,獲取文件中所有的根節點;
根據根節點在XML索引文件中查找對應的節點;
如果無法找到對應節點,在XML索引文件中建立虛節點,即在上下文中應該存在而不存在的節點,并在錯誤記錄中記錄此索引信息不完整需要通過其它相關文件建立完整的索引;
在XML索引文件中查找對應的節點下所有的子節點;
將文件解析的結果將相關索引信息(索引信息包含索引的關鍵字、文件名、文件路徑、索引內容在文件中的位置等)根據與子節點關系逐一添加到XML索引文件中;
根據索引規則如果無法找到與索引信息對應的子節點,檢查配置是否允許添加子節點;
如果允許,則直接添加相關節點,檢查是否有歷史上的虛節點與此次添加的節點相關,如果有則將虛節點變為實際的節點并在錯誤記錄中清除相關的錯誤記錄來修正索引;
如果不允許,則添加相關的虛節點,并將此錯誤保存到錯誤記錄中。
進一步的,本申請實施例提供的技術方案還可以判斷所述文件系統的配 置信息是否有完整性檢查要求;如果有完整性檢查要求,則進行完整性檢查,并將檢查出的錯誤保存到錯誤記錄中;生成錯誤列表,所述錯誤列表中包括此文件所有的錯誤記錄,并保存所述XML索引文件,提示文件建立者索引建立成功。
應用本申請的文件索引的建立方法,接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。這樣,在文件編寫過程中即可根據文件名稱以及文件的格式信息建立多維度XML索引文件,在文件使用的過程中,只需要查詢XML索引文件就可以知道所需信息是否存在、定位所需信息所在的具體位置以及信息間的相關性,能夠使檢索的過程得到簡化,并可以準確檢索到有效信息。
對于前述的方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本發明并不受所描述的動作順序的限制,因為依據本發明,某些步驟可以采用其他順序或者同時進行。
圖3為本申請實施例提供的一種文件索引的建立系統的結構示意圖。
參照圖3所示,本申請實施例提供的文件索引的建立系統,包括:
編寫模塊1,用于接收按照預設的格式信息編寫的文件,并按照預設的命名規范將接收的所述文件以預設的文件名稱保存;
查找模塊2,用于根據設置在文件系統上的偵聽器偵聽所述文件名稱,并根據所述文件名稱查找相對應的文件解析器;
解析模塊3,用于通過查找的解析器從所述文件的格式信息中解析關鍵字,并根據預設規則將所述關鍵字添加到XML索引文件中。
所述查找模塊2,包括:
查找單元,用于獲得所述文件名稱,根據所述命名規范查找與所述文件名稱相對應的文件解析器,判斷是否查找到與所述文件名稱相對應的文件解 析器;
判斷單元,用于如果未查找到與所述文件名稱相對應的文件解析器,根據所述文件系統的配置信息判斷所述文件系統中是否允許保存非規范文件;
第一輸出單元,用于如果所述文件系統中不允許保存非規范文件,輸出無法找到文件解析器的提示信息,并保存到錯誤記錄中。
所述查找模塊2,還包括:
第二輸出單元,用于如果所述文件系統中允許保存非規范文件,輸出無法找到文件解析器的提示信息,并判斷是否將所述文件作為非規范文件保存;
添加單元,用于如果將所述文件作為非規范文件保存,則將所述文件作為非規范文件添加到XML索引文件中;
保存單元,用于如果不將所述文件作為非規范文件保存,則保存到錯誤記錄中。
所述解析模塊3,具體用于:
清除所述XML索引文件中與所述文件相關的索引節點;
檢查所述文件的格式信息,判斷所述格式信息是否正確;
如果所述格式信息不正確,將保存到錯誤記錄中,并輸出無法解析所述文件的提示信息;
如果所述格式信息正確,獲取所述文件中全部的根節點;
在所述XML索引文件中查找與所述根節點對應的節點;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點,則在所述XML索引文件中建立虛節點,并保存到錯誤記錄中;
如果在所述XML索引文件中查找到與所述根節點對應的節點,則在所述XML索引文件中查找與所述根節點對應的節點下的所有子節點;
如果在所述XML索引文件中查找到與所述根節點對應的節點下的子節點,則將索引信息與子節點的關系逐一添加到所述XML索引文件中;
如果在所述XML索引文件中無法查找到與所述根節點對應的節點下的子節點,判斷所述文件系統的配置信息是否允許添加子節點;
如果允許,則添加子節點,檢查所述XML索引文件中是否包括與添加的子節點相關的虛節點,如果有,則將與添加的子節點相關的虛節點變為實際 的節點并在錯誤記錄中清除相關的錯誤記錄;
如果不允許,則添加相關的虛節點,并保存到錯誤記錄中。
所述解析模塊3,還用于:
判斷所述文件系統的配置信息是否有完整性檢查要求;
如果有完整性檢查要求,則進行完整性檢查,并將檢查出的錯誤保存到錯誤記錄中;
生成錯誤列表,所述錯誤列表中包括所有的錯誤記錄,并保存所述XML索引文件。
本申請實施例提供的文件索引的建立系統,可以采用上述方法實施例中的文件索引的建立方法,此處不再贅述。
本申請實施例提供的技術方案,根據特定的文件命名規范和文件模板建立文件解析器使得在文件管理的過程中有能力對文件內的信息進行深入挖掘,基于信息本身而不僅僅是簡單的文件名建立索引。在文件解析的過程中,不僅對信息進行的挖掘,與此同時也對信息組織的結構化進行了檢查,確保了文件內容格式化的有效性。基于XML格式,可以將信息索引以多種不同的維度進行保存,從而避免了文件系統結構本身所帶來的限制。通過在文件以及XML索引文件之間的雙向交互,不僅完善了索引本身同時還可以對文件內容的完整性進行檢查。總之在文件建立的過程中,不僅建立多維度的索引,還可以完成文件格式化和內容完整性檢查,使得對于文件的處理、維護、檢索和檢查更加方便快捷。在信息檢索的過程中,文件使用者可以通過XML索引文件非常明確的了解所需信息是否存在以及所在的具體位置,而不再存在任何可能的歧義,能夠切實的提高文件使用者獲取文件的效率。
通過XML索引文件使文件獲取成本降低了,文件使用者就會對文件質量提出更高的要求,文件使用變得更為頻繁也進一步提升文件建立者的積極性,在文件使用者和文件建立者的雙重推動下,文件質量也會逐步提高,從而進一步提升使用文件的效益,從而進入一個良性循環。
需要說明的是,在本申請實施例中是用XML格式保存索引信息,而在基于本申請的其它實施例中,不僅可以用XML格式保存索引信息,也可以通過 其它定制的結構化格式,例如json格式,二進制對象串行化格式或者數據庫保存索引信息,另外,在一定的條件下可以使用全文檢索而不是定制的文件解析器進行解析。
為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現。
本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置或系統實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的裝置及系統實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性勞動的情況下,即可以理解并實施。
專業人員還可以進一步意識到,結合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結合來實現,為了清楚地說明硬件和軟件的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執行,取決于技術方案的特定應用和設計約束條件。專業技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不應認為超出本發明的范圍。
結合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執行的軟件模塊,或者二者的結合來實施。軟件模塊可以置于隨機存儲器(RAM)、內存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術領域內所公知的任意其它形式的存儲介質中。
對所公開的實施例的上述說明,使本領域專業技術人員能夠實現或使用本發明。對這些實施例的多種修改對本領域的專業技術人員來說將是顯而易 見的,本文中所定義的一般原理可以在不脫離本發明的精神或范圍的情況下,在其它實施例中實現。因此,本發明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。

關 鍵 詞:
一種 文件 索引 建立 方法 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種文件索引的建立方法及系統.pdf
鏈接地址:http://www.wwszu.club/p-6373732.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大