鬼佬大哥大
  • / 13
  • 下載費用:30 金幣  

將數據實時分類到數據壓縮域.pdf

摘要
申請專利號:

CN201480004452.5

申請日:

2014.01.03

公開號:

CN104919430A

公開日:

2015.09.16

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 12/00申請日:20140103|||公開
IPC分類號: G06F12/00; G06F3/06; G06F17/30 主分類號: G06F12/00
申請人: 國際商業機器公司
發明人: N·哈羅瓦尼; L·德米多; S·馬倫科夫; C·科伊夫曼; J·阿秘特; D·索特尼科夫; R·I·卡特; G·戈爾德伯格; D·哈尼克; O·馬加里特
地址: 美國紐約
優先權: 13/738,333 2013.01.10 US
專利代理機構: 中國國際貿易促進委員會專利商標事務所11038 代理人: 吳信剛
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201480004452.5

授權公告號:

||||||

法律狀態公告日:

2018.10.12|||2015.10.14|||2015.09.16

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

為了將數據實時分類到數據壓縮域,通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個寫操作產生指紋。將具有相似指紋的寫操作在相似的壓縮流中壓縮在一起。

權利要求書

權利要求書
1.  一種方法,用于在計算環境中由處理器設備將數據實時分類到數據壓縮
域,該方法包括:
通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個寫操作產生指紋;以及
將具有相似指紋的寫操作在壓縮流中壓縮在一起。

2.  根據權利要求1所述的方法,進一步包括:將具有不同指紋的所述寫操作分
開到不同的壓縮流。

3.  根據權利要求2所述的方法,還包括對每個所述寫操作的每個指紋和之前轉發至每個所述數據壓縮域的寫操作的指紋進行比較。

4.  根據權利要求3所述的方法,進一步包括將具有所述相似指紋的所述寫操作發送至壓縮所述寫操作的相似數據的所述數據壓縮域。

5.  根據權利要求4所述的方法,進步一步包括將所述寫操作發送至新數據壓縮域,其中新壓縮流被創建。

6.  根據權利要求1所述的方法,進一步包括使用啟發法的以下組合或至少之一計算所述分類啟發的組:隨機選擇的數據的熵,構成所述隨機選擇的數據的大多數字節的核心字符集和字符的大小,所述隨機選擇的數據或所述核心字符集的全部或部分直方圖,所述隨機選擇的數據的主要字符的組或非主要字符的組,所述全部或部分直方圖或所述核心字符集的平均值、方差和可選契機之一,以及所述數據的數據結構的指示。

7.  根據權利要求1所述的方法,進一步包括使用保相似哈希SPH計算所述分類啟發的組。

8.  一種系統,用于在計算環境中由處理器設備將數據實時分類到數據壓縮
域,該系統包括:
工作在計算存儲環境中的處理器設備,其中所述處理器設備:
通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個所述寫操作產生指紋;以及
將具有相似指紋的寫操作在壓縮流中壓縮在一起。

9.  根據權利要求8所述的系統,其中所述處理器設備將具有不同指紋的所述寫
操作分開到不同的壓縮流。

10.  根據權利要求9所述的系統,其中所述處理器設備對每個所述寫操作的每個指紋和之前轉發至每個所述數據壓縮域的寫操作的指紋進行比較。

11.  根據權利要求10所述的系統,其中所述處理器裝置將具有所述相似指紋的所述寫操作發送至壓縮所述寫操作的相似數據的所述數據壓縮域。

12.  根據權利要求11所述的系統,其中所述處理器裝置將所述寫操作發送至新數據壓縮域,其中所述新壓縮流被創建。

13.  根據權利要求8所述的系統,其中所述處理器裝置使用所述啟發法的以下組合或至少之一計算所述分類啟發的組:
隨機選擇的數據的熵,構成所述隨機選擇的數據的大多數字節的核心字符集和字符的大小,所述隨機選擇的數據或所述核心字符集的全部或部分直方圖,
所述隨機選擇的數據的主要字符的組或非主要字符的組,所述全部或部分直方圖或所述核心字符集的平均值、方差和可選契機之一,以及所述數據的數據結構的指示。

14.  根據權利要求8所述的系統,其中所述處理器裝置使用保相似哈希SPH計算所述分類啟發的組。

15.  一種計算機程序產品,由處理器將數據實時分類到數據壓縮域,所述計算機程序產品包括其上存儲有計算機可讀程序代碼部分的計算機可讀存儲介質,所述計算機可讀程序代碼部分包括:
第一可執行部分,其通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個寫操作產生指紋;以及
第二可執行部分,其將具有相似指紋的寫操作在壓縮流中壓縮在一起。

16.  根據權利要求15所述的計算機程序產品,進一步包括第三可執行部分,其將具有不同指紋的所述寫操作分開到不同的壓縮流。

17.  根據權利要求16所述的計算機程序產品,進一步包括第四可執行部分,其對每個所述寫操作的每個指紋和之前轉發至每個所述數據壓縮域的寫操作的指紋進行比較。

18.  根據權利要求17所述的計算機程序產品,進一步包括第五可執行部分,將具有所述相似指紋的所述寫操作發送至壓縮所述寫操作的相似數據的所述數據壓縮域。

19.  根據權利要求18所述的計算機程序產品,進一步包括第六可執行部分,其
將所述寫操作發送至新數據壓縮域,其中所述新壓縮流被創建。

20.  根據權利要求15所述的計算機程序產品,進一步包括的第三可執行部分,其使用所述啟發法的組合或至少之一計算所述分類啟發的組:
隨機選擇的數據的熵,構成所述隨機選擇的數據的大多數字節的核心字符集和字符的大小,所述隨機選擇的數據或所述核心字符集的全部或部分直方圖,所述隨機選擇的數據的主要字符的組或非主要字符的組,所述全部或部分直方圖或所述核心字符集的平均值、方差和可選契機之一,以及所述數據的數據結構的指示,以及
使用保相似哈希SPH計算所述分類啟發的組。

說明書

說明書將數據實時分類到數據壓縮域
技術領域
本發明一般涉及計算機,更具體地涉及在計算環境中將數據實時分類到數據壓縮域。
背景技術
當今社會中,計算機系統是普遍的。可在工作場所、在家里、或在學校發現計算機系統。計算機系統可以包括數據存儲系統或盤存儲系統以處理和存儲數據。數據存儲系統或盤存儲系統被用來處理和存儲數據。存儲系統可包括一個或多個盤驅動器。這些數據處理系統通常需要大量的數據存儲。客戶數據或者數據處理系統內的用戶所產生的數據占據該數據存儲的很大的部分。這些計算機系統中的許多系統包括虛擬存儲組件。
數據壓縮被廣泛用于減少處理、傳輸或存儲給定量的信息所需要的數據量。數據壓縮是為了最小化數據的表示而對數據進行的編碼。例如,壓縮可被用于減少文件的存儲需求、提高信道上的通信速率、或者在加密之前減少冗余以提高安全性。
發明內容
在一個實施例中,提供一種利用處理器裝置將數據實時分類到數據壓縮域的方法。為了將數據實時分類到數據壓縮域,通過讀取隨機選擇的計算一組分類啟發(classifying heuristics)的寫操作的數據來決定應該將寫操作轉發至哪 個數據壓縮域,從而為每個寫操作產生指紋。將具有相似指紋(fingerprint)的寫操作在相似的壓縮流中壓縮在一起。
在另一實施例中,提供一種用于將數據實時分類到數據壓縮域的計算機系統,該計算機系統包括計算機可讀介質和與所述計算機可讀介質通信的處理器。為了將數據實時分類到數據壓縮域,處理器通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個寫操作產生指紋。將具有相似指紋的寫操作在相似的壓縮流中壓縮在一起。
在又一實施例中,提供一種用于將數據實時分類到數據壓縮域的計算機程序產品。該計算機可讀存儲介質具有存儲在其上的計算機可讀程序代碼部分。計算機可讀程序代碼部分包括第一可執行部分,其通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個寫操作產生指紋。將具有相似指紋的寫操作在相似的壓縮流中壓縮在一起。
除了上述示例性方法實施例之外,還提供了其它的示例性系統和計算機產品的實施例并提供相關的優點。已經提供了上述概要以便以簡化的形式介紹將在下面的詳細描述中進一步描述的構思的精選。本概要并不旨在識別要求保護的主題的關鍵特征或必要特征,也不是旨在用于幫助確定要求保護的主題的范圍。要求保護的主題并不限于解決背景技術中提到的任何或所有缺點的實施方式。
附圖說明
現在將要參考附圖,僅通過舉例的方式描述本發明的多個實施例,其中:
圖1示出可在其中實現本發明的各方面的具有示例性存儲設備的計算機存儲環境的框圖;
圖2示出可在其中實現本發明的各方面的計算機系統中的示例性數據存儲系統的硬件結構的框圖;
圖3示出可以實現本發明的各方面的將數據實時分類至數據壓縮域的示意性方法的流程圖;以及
圖4示出可以實現本發明的各方面的將數據實時分類至數據壓縮域的附加示意性方法的流程圖。
具體實施方式
如之前提及的,計算系統被用于存儲和管理各種類型的數據。利用相同的壓縮流壓縮相似的數據提高壓縮率和減少所需的存儲器。然而,當寫數據時,即使一個文件中的連續塊,內容也不總是相似。例如,考慮具有圖像和文字的文件。如果為具有圖像和文字的文件創建兩個分開的壓縮流,那么將每種類型的數據發送至分開的壓縮流,極大地提高數據壓縮的效率并且提升全部數據的壓縮率。
在塊存儲系統中,將數據塊寫入到存儲器中而不指示寫入什么類型的數據,并且沒有給出寫之間的關系指示(例如相同文件的寫和相同數據類型的寫)。因此,當壓縮數據的寫操作時,能夠把數據壓縮在一起,這些數據沒有公共屬性(并且沒有重復),這將導致壓縮率降級。塊存儲系統沒有寫入數據的類型(或類)信息并且無法利用這一點。解決這個挑戰的嘗試包括利用邏輯塊地址(LBA)空間的空間局部性(spatial locality)的塊系統的解決方案。將 到給定LBA范圍的任何寫壓縮到一起,并且這有點如同文件系統/數據庫分配策略——以連續的方式分配文件或相關的文件。這種解決方案遵循流行的啟發法——在單個文件中的數據是相似的并且應該在單個壓縮流中被壓縮。啟發法被發現不總是正確的,因此數據壓縮效率降低。因此,有必要實時做出使用哪個壓縮流的決定,否則使用分開的壓縮流是不實際的。因此,選擇使用哪個壓縮流的決策邏輯應該快速(快速是相對而言并且應該是使用當前現有技術可用硬件壓縮數據所需時間的一部分)。
這樣,在一個實施例中,本發明提供一種解決方案,利用處理器裝置將數據實時分類到數據壓縮域。為了將數據實時分類到數據壓縮域,通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定將寫操作應該轉發至哪個數據壓縮域,從而為每個寫操作產生指紋。將具有相似指紋的寫操作在相似的壓縮流中壓縮在一起。
如下所述,在一個實施例中,本發明“檢測”到沒有先前信息的數據的“類”(或特性)(例如,壓縮域或壓縮流被分類)。本發明允許基于數據域寫入多個壓縮流。本發明識別并決定應該將寫操作應該轉發至哪個壓縮域并決定使用哪個壓縮流。壓縮域可以具有一個或多個有效(active)的壓縮流。檢測方法讀取隨機選取的輸入數據的小片段,并且計算一組分類啟發以產生數據的指紋。將在單個壓縮流中具有相似指紋的數據壓縮在一起,而將包含具有不同指紋和特性的數據(例如圖像與文本)的寫操作劃分到不同的壓縮流中。這種數據分類和劃分利用多個機器增加了效率并通過在單個流中保持相似的數據允許更多的節點幫助壓縮數據來更好地使用分布式系統(即多個壓縮節點)。為了決定使用哪個壓縮域和流,識別和檢測算法非常快并且不需要壓縮數據。
現在轉到圖1,描繪了計算環境中的數據存儲系統的示例性架構10。計算機系統10包括連接到(多個)大容量存儲(storage)設備14和存儲器(memory) 設備16的中央處理單元(CPU)12。大容量存儲設備可以包括硬盤驅動器(HDD)設備、固態器件(SSD)等,它們可以配置在獨立盤冗余陣列(RAID)中。進一步描述的備份操作可以在位于系統10中或其他地方的(多個)設備14上執行。存儲器設備16可以包括諸如電可擦除可編程只讀存儲器(EEPROM)的存儲器或相關設備的主機。存儲器設備16和大容量存儲設備14經由信號承載介質連接到CPU 12。此外,CPU 12通過通信端口18連接到具有附接的多個附加計算機系統22和24的通信網絡20。
圖2是示出根據本發明的計算機系統中的數據存儲系統的硬件結構的示例性框圖200。參照圖2,示出了主機計算機210、220、225,各自作為中央處理單元,用于執行數據存儲系統200的一部分的數據處理。主機(物理或虛擬設備)210、220和225可以是數據存儲系統200中實現本發明的目的的一個或多個新的物理設備或邏輯設備。在一個實施例中,僅僅通過示例的方式,數據存儲系統200可以被實現為系統存儲TM DS8000TM。網絡連接260可以是光纖信道織網(fabric)、光纖信道點對點鏈路、以太網織網或點對點鏈路上的光纖信道、FICON或ESCON I/O接口、任何其它的I/O接口類型、無線網絡、有線網絡、局域網(LAN)、廣域網(WAN)、異構的、同構的、公共的(即因特網)、私有的,或者它們的任意組合。主機210、220和225可以是本地的或者分布在一個或多個位置之中,并且可配備有到存儲控制器240的任何類型的織網(或織網信道)(圖2中未示出)或網絡適配器260,諸如光纖信道、FICON、ESCON、以太網、光纖、無線或同軸適配器。數據存儲系統200相應地配備有合適的織網(圖2中未示出)或網絡適配器260以進行通信。數據存儲系統200被描繪在圖1中,包括存儲控制器240和儲存器(storage)230。
為了便于更清楚地理解本文描述的方法,存儲控制器240被作為單個處理單元顯示在圖2中,其包括微處理器242、系統存儲器243和非易失性存儲(“NVS”)216,它們將在下面更詳細地描述。應注意,在一些實施例中,存儲 控制器240由多個處理單元構成,每個單元具有自己的處理器復合體和系統存儲器,并通過數據存儲系統200內的專用網絡互連。儲存器230可以包括一個或多個存儲設備(諸如存儲陣列),其通過存儲網絡連接到存儲控制器240。
在一些實施例中,儲存器230中包括的設備可以連接為環形架構。存儲控制器240管理儲存器230,并促進針對儲存器230的寫入和讀出請求的處理。存儲控制器240的系統存儲器243存儲程序指令和數據,處理器242可以訪問該程序指令和數據以執行與管理儲存器230相關聯的功能和方法步驟,以及執行計算機存儲環境中的本發明的步驟和方法。在一個實施例中,系統存儲器243包括計算機存儲環境中的操作軟件250,或者與之相關聯或與之進行通信,該操作軟件250包括這里描述的方法和操作。如圖2所示,系統存儲器243還可以包括用于儲存器230的高速緩存(cache)245或與之通信,高速緩存245在此也稱為“高速緩沖存儲器”,用于緩沖“寫入數據”和“讀出數據”,其分別指代讀/寫請求和它們的相關的數據。在一個實施例中,高速緩存245被分配在系統存儲器243外部的設備中,但仍然可由微處理器242訪問,并且可以在除了實現本文中描述的操作之外,還用來提供防止數據丟失的附加安全性。
在一些實施例中,高速緩存245由易失性存儲器和非易失性存儲器實現,并通過本地總線(圖2中未示出)耦合(couple)到微處理器242以增強數據存儲系統200的性能。包括在數據存儲控制器中的NVS 216可由微處理器242訪問,并且用于對在其它附圖中描述的本發明的操作和執行提供附加支持。該NVS 216,也可以被稱為“永久(persistent)”高速緩存或“高速緩沖存儲器”,并由可能或可能不使用外部電源來保留其中存儲的數據的非易失性存儲器來實現。為了任何適合于實現本發明的目標的目的,可以將NVS存儲在高速緩存245中并與該高速緩存245一起存儲。在一些實施例中,諸如電池的備用電源(圖2中未示出)為NVS 216供給足夠的功率,以在數據存儲系統200 有電力丟失的情況下保留存儲在NVS 216中的數據。在某些實施例中,NVS216的容量小于或等于高速緩存245的總容量。
儲存器230物理上可以包括一個或多個存儲設備,諸如存儲陣列。存儲陣列是諸如硬盤的單獨(individual)存儲設備的邏輯分組。在某些實施例中,儲存器230包括JBOD(簡單盤捆綁)陣列或RAID(獨立盤冗余陣列)陣列。物理存儲陣列的集合可以被進一步組合以形成隊列(rank),其使得物理存儲與邏輯配置分離。隊列中的存儲空間可被分配為邏輯卷,其定義讀/寫請求中指定的存儲位置。
在一個實施例中,僅僅通過示例的方式,圖2所示的存儲系統可以包括邏輯卷,或簡稱為“卷”,可以有不同的種類的分配。儲存器230a、230b和230n被示出作為數據存儲系統200中的隊列,并在本文中被稱為隊列230a、230b和230n。隊列可以是數據存儲系統200本地的,或者可以位于物理上的遠程位置。換言之,本地存儲控制器可以與遠程存儲控制器連接并管理遠程位置處的存儲。隊列230a被示出配置了兩個完整卷234和236,以及一個部分卷232a。隊列230b被示出配置了另一部分卷232b。因此卷232被跨隊列230a和230b分配。隊列230n被示出為完全分配給卷238——也就是說,隊列230n指代卷238的整個物理存儲。從上面的例子,應理解,隊列可以被配置為包括一個或多個部分和/或完整的卷。卷和隊列可被進一步分為所謂的“軌道(track)”,它表示儲存器的固定塊。因此,軌道與給定的卷相關聯,并且可以被給予給定隊列。
在計算機存儲環境中,存儲控制器240可以包括壓縮流模塊255、數據壓縮域模塊257和數據分類模塊259。壓縮流模塊255、數據壓縮域模塊257和數據分類模塊259可以與存儲控制器240、主機210、220、225和存儲設備230的每個組件協同工作。壓縮流模塊255、數據壓縮域模塊257和數據分類模塊 259可以被結構化為在共同工作的一個完整模塊并且彼此協同工作來執行下面描述的這種功能,或者可以是單個模塊。壓縮流模塊255、數據壓縮域模塊257和數據分類模塊259也可以位于存儲控制器240的高速緩存245或其它組件中來實現本發明的目的。
存儲控制器240可以被構造為具有用于控制光纖通道協議到主計算機210、220和225的控制開關241、用于控制所有的存儲控制器240的微處理器242、用于存儲微程序(操作軟件)250以控制存儲控制器240的操作的非易失性控制存儲器243、用于控制的數據和后面描述的每個表、用于臨時存儲(緩沖)數據的高速緩存245、用于幫助高速緩存245讀寫數據的緩沖器244、用于控制協議來控制數據傳輸至/來自設備230的控制開關241、壓縮流模塊255、數據壓縮域模塊257以及其上可以設置信息的數據分類模塊259。本發明可以在計算環境中實現多個緩沖器244,或者根據描述實施例的機制來執行其它功能。
在一個實施例中,僅僅通過示例的方式,主計算機或一個或多個物理或虛擬設備210、220、225和存儲控制器240通過網絡適配器260(這可以是光纖通道)作為接口(即,經由有時被稱為“織網(fabric)”的交換機)連接在一起。在一個實施例中,僅僅通過示例的方式,描述圖2示出的系統操作。微處理器242可以控制存儲器(memory)243存儲來自于主機設備210(物理的或虛擬的)的指令信息和用于識別主機設備(物理的或虛擬的)210的信息。控制開關(switch)241、緩沖器244、高速緩存245、操作軟件250、微處理器242、存儲器243、NVS216、壓縮流模塊255、數據壓縮域模塊257以及數據分類模塊259彼此通信并且可以是分開的或者一個單獨的組件。此外,一些組件(如果不是所有)(諸如操作軟件245)可以與存儲器243一起被包含在計算機存儲環境中。存儲設備內的每個組件可鏈接在一起,并可以為了與本發明相適應的目的互相通信。
現在參照圖3,示出將數據實時分類到數據壓縮域的示意性方法300。方法300開始(步驟302)通過讀取隨機選擇的計算一組分類啟發的寫操作的數據來決定應該將寫操作轉發至哪個數據壓縮域,從而為每個寫操作產生指紋(步驟304)。方法300將具有相似指紋的寫操作在壓縮流中壓縮在一起(步驟306)。方法300結束(步驟308)。
基于前述描述,現在參照圖4,其描述了將數據實時分類到數據壓縮域的附加示意性方法400。如圖3所述,為了識別和決定應該將寫操作轉發至哪個壓縮域以及為了決定使用哪個壓縮流,方法400開始(步驟402),選擇輸入數據緩的數據采樣(例如可以是由用戶定義的預定大小的較小數據采樣)(步驟404)。在一個實施例,輸入數據緩存可以是應用文件或數據塊。而且,所選擇的數據采樣可以是全部輸入緩存、從預定義的緩存隨機選擇的(或預定義的)字節序列或者可以是自適應的大小(例如自適應到目前為止采樣的數據)。
方法400使用對數據采樣的一組啟發計算數據的指紋(步驟406)。啟發可以快速計算(快速是相對于壓縮所需要的時間而言的)并且啟發能夠表明應該將什么數據壓縮在一起以及不應該將什么數據壓縮在一起。計算的指紋與已發送至每個有效/開放的壓縮流的之前數據的指紋進行比較(步驟408)。基于比較,將數據發送至壓縮相似數據的最適合的壓縮域/流(根據到數據指紋的距離)(步驟410)。術語距離是指指紋之間的相似度。例如,計算當前指紋與每個壓縮域/流壓縮的數據的指紋之間的漢明距,并且選擇具有最小距離的流。可以將指紋之間的距離計算為距離矢量,或者任何其它數學矢量距離函數。可選地,如果沒有最適合的壓縮域是有效/開放的(例如創建新的壓縮流),那么方法400可以將數據發送到新的壓縮域(步驟412)。方法400結束(步驟414)。
在一個實施例中,指紋啟發法可以是以下例子中的任何一個或者組合:(1)采樣數據的熵;(2)核心字符集(核心集)——構成采樣中的字節的大 多數(其被確定為預定的百分比)的字符的集合(和大小)。例如,構成采樣的90%的字符集合;(3)采樣日期或核心集的全部或部分直方圖,包括直方圖計數的壓縮格式(少于計數的位);(4)來自采樣的主要字符(dominant characters)或非主要字符(non-dominant characters)的組;(5)直方圖或核心集的平均值、方差和/或不同契機(different moment);以及(6)在數據中發現的數據結構的指示。例如,頭的存在(聯合圖像專家小組(JPEG)/圖像交換格式"(GIF)頭),數據的結構或定界符的存在。
在一個實施例中,指紋啟發(fingerprinting heuristic)的另外選擇是使用一些保相似哈希SPH(Similarity Preserving Hash)方法。SPH是跨數據集或部分數據集的函數,其中具有公共字符串的數據集也具有相同的值。以計算核心集(core-set)為例,本發明可以將核心集視為256長度的位矢量(假設核心集是字符)并且在核心集上應用一些糾錯碼(ECC)。因此,例如,如果在一個文件中核心集是A-Z并且在另一個文件中核心集是A-Z但沒有J,那么這個ECC會發現它們相似。還應該指出壓縮域可以在單個機器上或者在多個機器上一起工作來壓縮數據。
所屬技術領域的技術人員知道,本發明的各個方面可以實現為系統、方法或計算機程序產品。因此,本發明的各個方面可以具體實現為以下形式,即:完全的硬件實施方式、完全的軟件實施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結合的實施方式,這里可以統稱為“電路”、“模塊”或“系統”。此外,在一些實施例中,本發明的各個方面還可以實現為在一個或多個計算機可讀介質中的計算機程序產品的形式,該計算機可讀介質中包含計算機可讀的程序代碼。
可以采用一個或多個計算機可讀介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可 以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、便攜式計算機盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPROM或閃存)、光纖、便攜式緊湊盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執行系統、裝置或者器件使用或者與其結合使用。
計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸,包括——但不限于——無線、有線、光纜、RF等等,或者上述的任意合適的組合。可以以一種或多種程序設計語言的任意組合來編寫用于執行本發明操作的計算機程序代碼,所述程序設計語言包括面向對象的程序設計語言—諸如Java、Smalltalk、C++等,還包括常規的過程式程序設計語言—諸如“C”語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執行、部分地在用戶計算機上執行、作為一個獨立的軟件包執行、部分在用戶計算機上部分在遠程計算機上執行、或者完全在遠程計算機或服務器上執行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網絡——包括局域網(LAN)或廣域網(WAN)—連接到用戶計算機,或者,可以連接到外部計算機(例如利用因特網服務提供商來通過因特網連接)
下面將參照根據本發明實施例的方法、裝置(系統)和計算機程序產品的流程圖和/或框圖描述本發明。應當理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合,都可以由計算機程序指令實現。這些計算機程序指令可以提供給通用計算機、專用計算機或其它可編程數據處理裝置的處理器,從而生產出一種機器,使得這些計算機程序指令在通過計算機或其它可編程數據處理裝置的處理器執行時,產生了實現流程圖和/或框圖中的一個或 多個方框中規定的功能/動作的裝置。
也可以把這些計算機程序指令存儲在計算機可讀介質中,這些指令使得計算機、其它可編程數據處理裝置、或其他設備以特定方式工作,從而,存儲在計算機可讀介質中的指令就產生出包括實現流程圖和/或框圖中的一個或多個方框中規定的功能/動作的指令的制造品(article of manufacture)。該計算機程序指令也可以被加載到計算機、其它可編程數據處理裝置或其它設備上,以引起在計算機、其它可編程裝置或其他設備上執行一系列操作步驟以產生計算機實現的處理,使得在計算機或其他可編程裝置上執行的指令能夠提供用于實現流程圖和/或框圖中的一個或多個方框中規定的功能/動作的處理。
附圖中的流程圖和框圖顯示了根據本發明的多個實施例的系統、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個用于實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發生。例如,兩個連續的方框實際上可以基本并行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或動作的專用的基于硬件的系統來實現,或者可以用專用硬件與計算機指令的組合來實現。
雖然已經詳細地說明了本發明的一個或多個實施例,本領域技術人員應理解,在不脫離如權利要求中所闡述的本發明的范圍的情況下,可以對這些實施例作出修改和改變。

關 鍵 詞:
數據 實時 分類 數據壓縮
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:將數據實時分類到數據壓縮域.pdf
鏈接地址:http://www.wwszu.club/p-6373653.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大