鬼佬大哥大
  • / 23
  • 下載費用:30 金幣  

對文檔的查詢和索引.pdf

摘要
申請專利號:

CN201380064583.8

申請日:

2013.12.09

公開號:

CN105027115A

公開日:

2015.11.04

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20131209|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 微軟技術許可有限責任公司
發明人: L·張; M·布度; Y·于; G·D·普洛特金
地址: 美國華盛頓州
優先權: 13/709,064 2012.12.10 US
專利代理機構: 上海專利商標事務所有限公司31100 代理人: 陳小剛
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201380064583.8

授權公告號:

||||||

法律狀態公告日:

2018.10.16|||2015.12.02|||2015.11.04

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

根據文檔集合生成文檔索引并將其用來標識匹配一個或多個查詢的文檔。為每一文檔生成具有與文檔的每一對象相對應的節點的樹。所生成的樹的各節點被歸并或組合以生成文檔索引,它本身是樹。另外,為該索引的每一節點生成標識該節點源自的一個或多個樹的倒排索引。在接收到查詢時,該查詢首先對照文檔索引樹來執行。在執行期間,正確的集合操作被應用于與該查詢所匹配的節點相關聯的倒排索引。所得的集合標識可與該查詢相匹配的文檔。該查詢隨后在所標識的文檔上執行。

權利要求書

權利要求書
1.  一種方法,包括:
由計算設備接收多個文檔,其中每一文檔包括多個對象;
對于每一文檔,由所述計算設備生成表示所述文檔的圖,其中每一個圖包括與所表示的文檔的每一對象相對應的節點;
通過由所述計算設備歸并所生成的圖的各節點來生成文檔索引,其中所述文檔索引中的每一節點包括包含該節點的一個或多個圖的標識符;
由所述計算設備接收查詢;
由所述計算設備使用所生成的文檔索引來標識所述多個文檔中的作為所述查詢的響應的一個或多個文檔;
由所述計算設備在所標識的一個或多個文檔上運行所述查詢以生成所標識的一個或多個文檔的子集;以及
由所述計算設備提供一個或多個所標識的文檔的所述子集作為所述查詢的響應。

2.  如權利要求1所述的方法,其特征在于,所述多個所標識的文檔包括文檔片段。

3.  如權利要求1所述的方法,其特征在于,所述查詢包括多個子查詢,并且使用所生成的文檔索引來標識所述多個文檔中的作為所述查詢的響應的一個或多個文檔包括:
對于每一子查詢:
確定所述文檔索引中的與所述子查詢相匹配的節點;以及
對于每一所確定的與所述子查詢相匹配的節點,確定由所確定的節點所標識的圖;
為每一子查詢確定所確定的圖的并集;以及
將由所確定的圖并集的各個圖來表示的一個或多個文檔標識為對所述查詢進行響應的所標識的一個或多個文檔。

4.  如權利要求1所述的方法,其特征在于,所述圖包括樹。

5.  如權利要求1所述的方法,其特征在于,所述查詢包括多個子查詢,并且所述方法還包括:
根據接收到的查詢的每一子查詢來生成矩陣;
根據每一子查詢生成矩陣操作;
根據所述文檔索引生成矩陣;以及
通過評估根據接收到的查詢的每一子查詢所生成的矩陣、根據所述文檔索引生成的矩陣、以及根據每一子查詢生成的矩陣操作,來標識所述多個文檔中的作為所述查詢的響應的一個或多個文檔。

6.  如權利要求1所述的方法,其特征在于,還包括生成接收到的查詢的圖,并且使用所生成的文檔索引來標識所述多個文檔中的作為搜索查詢的響應的一個或多個文檔包括:對所述文檔索引與接收到的查詢的所生成的圖的積執行圖搜索。

7.  一種系統,包括:
計算設備;
索引引擎,所述索引引擎被適配成根據多個文檔生成文檔索引,其中所述文檔索引包括多個節點,并且每一節點標識一個或多個文檔;以及
查詢引擎,其被適配成:
接收查詢;
使用所生成的文檔索引來標識所述多個文檔中的作為所述查詢的響應的一個或多個文檔;
在所述一個或多個文檔上運行所述查詢以生成所標識的一個或多個文檔的子集;以及
提供所述一個或多個文檔的所述子集作為所述查詢的響應。

8.  如權利要求7所述的系統,其特征在于,所述索引引擎被適配成根據多個文檔生成文檔索引包括:所述索引引擎被適配以:
對于每一文檔,生成表示所述文檔的圖,其中每一個圖包括與所表示的文 檔的對象相對應的節點;以及
通過歸并所生成的圖的各節點來生成文檔索引,其中所述文檔索引中的每一節點包括包含該節點的一個或多個圖的標識符。

9.  如權利要求8所述的系統,其特征在于,所述查詢包括多個子查詢,并且所述查詢引擎被適配成使用所生成的文檔索引來標識所述多個文檔中的作為所述查詢的響應的一個或多個文檔包括:所述查詢引擎被適配以:
對于每一子查詢:
確定所述文檔索引中的與所述子查詢相匹配的節點;以及
對于每一所確定的與所述子查詢相匹配的節點,確定由所確定的節點所標識的圖;
為每一子查詢確定所確定的圖的并集;以及
標識由所述圖的所確定的并集的各個圖所表示的一個或多個文檔。

10.  如權利要求7所述的系統,其特征在于,所述多個文檔是JavaScript對象記法(JSON)文檔和XML文檔中的一者或多者。

關 鍵 詞:
文檔 查詢 索引
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:對文檔的查詢和索引.pdf
鏈接地址:http://www.wwszu.club/p-6401600.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大