鬼佬大哥大
  • / 23
  • 下載費用:30 金幣  

搜索引擎及其實現方法.pdf

摘要
申請專利號:

CN201510342427.4

申請日:

2015.06.18

公開號:

CN104899322A

公開日:

2015.09.09

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06F 17/30申請日:20150618|||公開
IPC分類號: G06F17/30; G06F17/27 主分類號: G06F17/30
申請人: 百度在線網絡技術(北京)有限公司
發明人: 方高林
地址: 100085北京市海淀區上地十街10號百度大廈三層
優先權:
專利代理機構: 北京英賽嘉華知識產權代理有限責任公司11204 代理人: 王達佐; 馬曉亞
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510342427.4

授權公告號:

|||

法律狀態公告日:

2015.10.07|||2015.09.09

法律狀態類型:

實質審查的生效|||公開

摘要

本申請公開了一種搜索引擎及其實現方法。搜索引擎的實現方法包括:接收用戶輸入的查詢請求;獲取與查詢請求匹配的候選結果;基于點擊轉義模型確定查詢請求與每個候選結果之間的語義相關度;以及根據語義相關度對候選結果進行排序;其中,點擊轉義模型包括轉義詞典和/或非轉義詞典,轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。按照本申請的技術方案,按照語義相關度對搜索的候選結果進行排序,能夠提高搜索結果的排序效果,避免不符合用戶搜索需求的結果出現在搜索結果列表的前列,從而確保用戶具有良好的使用體驗。

權利要求書

權利要求書
1.  一種搜索引擎的實現方法,包括:
接收用戶輸入的查詢請求;
搜索與所述查詢請求匹配的候選結果;
基于點擊轉義模型確定所述查詢請求與每個候選結果之間的語義相關度;以及
根據所述語義相關度對候選結果進行排序;
其中所述點擊轉義模型包括轉義詞典和/或非轉義詞典,所述轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,所述非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。

2.  根據權利要求1所述的方法,其中,確定所述查詢請求與每個候選結果之間的語義相關度包括,針對每個候選結果:
確定所述查詢請求與候選結果的一個或多個語句之間的語義相關度,其中所述語句包括以下至少一項:候選結果的標題、錨文本和正文中的核心句子;以及
根據所確定的查詢請求與候選結果的一個或多個語句之間的語義相關度確定所述查詢請求與所述候選結果之間的語義相關度。

3.  根據權利要求2所述的方法,其中,確定所述查詢請求與候選結果的語句之間的語義相關度包括:
基于所述點擊轉義模型,利用句子間的文本主題匹配模型計算所述查詢請求與候選結果的語句之間的主題匹配相似度;
根據所述查詢請求與候選結果的語句之間的匹配狀況確定轉義因子;以及
基于所述轉義因子和所述主題匹配相似度計算查詢請求與候選結果的語句之間的語義相關度。

4.  根據權利要求3所述的方法,其中,基于所述點擊轉義模型計算所述查詢請求與候選結果的語句之間的主題匹配相似度包括:
利用詞對齊從候選結果的語句中確定與所述查詢請求中的詞語對齊的相鄰上文和下文;
根據所述轉義詞典和/或非轉義詞典調整候選結果的語句中的對應上文和下文的相似度權重;以及
根據調整后的相似度權重,利用句子間的文本主題匹配模型計算所述查詢請求與候選結果的語句之間的主題匹配相似度。

5.  根據權利要求4所述的方法,其中,根據轉義詞典和/或非轉義詞典調整候選結果的語句中的對應上文和下文的相似度權重,包括:
若非轉義詞典中包括候選結果的語句中的對應詞語及其上文或下文,則降低該上文或下文的相似度權重;以及
若轉義詞典中包括候選結果的語句中的對應詞語及其上文或下文,則調高該上文或下文的相似度權重。

6.  根據權利要求4所述的方法,其中,所述句子間的文本主題匹配模型為向量空間模型:
Sim(Q,S)=Σw1k=w2l(Wgt(w1k)*Wgt(w2l))Σk-1...MWgt(w1k)2Σl-1...NWgt(w2l)2*SentType(Q,S)]]>
其中,Sim(Q,S)表示Q和S之間的主題匹配相似度,Q表示查詢請求,S表示候選結果的語句,SentType(Q,S)表示兩個句子類型匹配的權重系數,Wgt(w1k)表示從查詢請求中得到的詞w1k的相似度權重,M為詞w1k的數量,Wgt(w2l)表示從候選結果的語句中得到的詞w2l的相似度權重,N為詞w2l的數量。

7.  根據權利要求3所述的方法,其中,根據所述查詢請求與候選結果的語句之間的匹配狀況確定轉義因子包括:
若匹配狀況為查詢請求中最重要的詞語沒有在候選結果的語句中出現,則轉義因子確定為第一值;
若匹配狀況為存在上下文的匹配,則轉義因子確定為第二值;以及
若匹配狀況為不存在上下文的完全匹配,則轉義因子確定為第三值,
其中,所述第一值小于第二值,并且所述第二值小于第三值。

8.  根據權利要求3所述的方法,其中,按下式計算查詢請求與候選結果的語句之間的語義相關度:
Rele(Q,S)=β(Q,S)Sim(Q,S)
其中,Rele(Q,S)表示Q和S之間的語義相關度,β(Q,S)表示Q和S之間的轉義因子,Sim(Q,S)表示Q和S之間的主題匹配相似度,Q表示查詢請求,S表示候選結果的語句。

9.  根據權利要求1所述的方法,其中,所述點擊轉義模型中的轉義詞典和非轉義詞典通過學習查詢請求與搜索結果Query-Title對的點擊數而構建。

10.  根據權利要求9所述的方法,其中,所述轉義詞典和非轉義詞典包括通過如下方法而構建的原生轉義詞典和原生非轉義詞典:
獲取Query-Title對的點擊展現比,所述點擊展現比為點擊數與展現數之比,展現數指示搜索結果響應于查詢請求而被展現的次數,點擊數指示搜索結果響應于查詢請求而展現時被用戶點擊的次數;
利用詞對齊在搜索結果中獲取與查詢語句中詞語對齊的相鄰上下文;
將點擊展現比低于第一閾值的Query-Title對中的對應詞語及其上下文加入原生轉義詞典中;以及
將點擊展現比高于第二閾值的Query-Title對中的對應詞語及其上下文加入原生非轉義詞典中。

11.  根據權利要求10所述的方法,其中,所述轉義詞典和非轉義詞典還包括通過如下方法而構建的泛化轉義詞典和泛化非轉義詞典:
對查詢請求中的詞語標注語義類別;以及
利用所標注的語義類別構建與原生轉義詞典和原生非轉義詞典對應的泛化轉義詞典和泛化非轉義詞典。

12.  根據權利要求4或10所述的方法,其中,所述詞對齊包括同義詞對齊。

13.  一種搜索引擎,包括:
接收單元,用于接收用戶輸入的查詢請求;
搜索單元,用于搜索與所述查詢請求匹配的候選結果;
語義相關度確定單元,用于基于點擊轉義模型確定所述查詢請求與每個候選結果之間的語義相關度;以及
排序單元,用于根據所述語義相關度對候選結果進行排序;
其中所述點擊轉義模型包括轉義詞典和/或非轉義詞典,所述轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,所述非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。

14.  根據權利要求13所述的搜索引擎,其中,所述語義相關度確定單元包括:
計算單元,用于針對每個候選結果,確定所述查詢請求與候選結果的一個或多個語句之間的語義相關度,其中所述語句包括以下至少一項:候選結果的標題、錨文本和正文中的核心句子;以及
確定單元,用于根據所確定的查詢請求與候選結果的一個或多個語句之間的語義相關度確定所述查詢請求與所述候選結果之間的語義相關度。

15.  根據權利要求14所述的搜索引擎,其中,所述計算單元包括:
主題匹配相似度模塊,用于基于所述點擊轉義模型,利用句子間的文本主題匹配模型計算所述查詢請求與候選結果的語句之間的主題匹配相似度;
轉義因子模塊,用于根據所述查詢請求與候選結果的語句之間的匹配狀況確定轉義因子;以及
合成模塊,用于基于所述轉義因子和所述主題匹配相似度計算查詢請求與候選結果的語句之間的語義相關度。

16.  根據權利要求15所述的搜索引擎,其中,所述主題匹配相似度模塊用于:
利用詞對齊從候選結果的語句中確定與所述查詢請求中的詞語對齊的相鄰上文和下文;
根據所述轉義詞典和/或非轉義詞典調整候選結果的語句中的對應上文和下文的相似度權重;以及
根據調整后的相似度權重,利用句子間的文本主題匹配模型計算所述查詢請求與候選結果的語句之間的主題匹配相似度。

17.  根據權利要求15所述的方法,其中,所述轉義因子模塊用于:
若匹配狀況為查詢請求中最重要的詞語沒有在候選結果的語句中 出現,則轉義因子確定為第一值;
若匹配狀況為存在上下文的匹配,則轉義因子確定為第二值;
若匹配狀況為不存在上下文的完全匹配,則轉義因子確定為第三值,
其中,所述第一值小于第二值,并且所述第二值小于第三值。

18.  根據權利要求13所述的搜索引擎,其中,所述點擊轉義模型中的轉義詞典和非轉義詞典通過學習查詢請求與搜索結果Query-Title對的點擊數而構建。

19.  根據權利要求18所述的搜索引擎,其中,所述轉義詞典和非轉義詞典包括通過如下方法而構建的原生轉義詞典和原生非轉義詞典:
獲取Query-Title對的點擊展現比,所述點擊展現比為點擊數與展現數之比,展現數指示搜索結果響應于查詢請求而被展現的次數,點擊數指示搜索結果響應于查詢請求而展現時被用戶點擊的次數;
利用詞對齊在搜索結果中獲取與查詢語句中詞語對齊的相鄰上下文;
將點擊展現比低于第一閾值的Query-Title對中的對應詞語及其上下文加入原生轉義詞典中;以及
將點擊展現比高于第二閾值的Query-Title對中的對應詞語及其上下文加入原生非轉義詞典中。

20.  根據權利要求19所述的搜索引擎,其中,所述轉義詞典和非轉義詞典還包括通過如下方法而構建的泛化轉義詞典和泛化非轉義詞典:
對查詢請求中的詞語標注語義類別;以及
利于所標注的語義類別構建與原生轉義詞典和原生非轉義詞典對應的泛化轉義詞典和泛化非轉義詞典。

說明書

說明書搜索引擎及其實現方法
技術領域
本公開一般涉及計算機技術領域,具體涉及信息檢索領域,尤其涉及一種搜索引擎及其實現方法。
背景技術
互聯網提供了對各種各樣的資源的訪問入口,這些資源例如包括圖像文件、音頻文件、視頻文件和網頁等。用戶可以通過搜索系統或搜索引擎來搜索希望訪問的資源。
在搜索過程中,通常由用戶輸入一個查詢(Query),搜索引擎返回與查詢匹配的結果。查詢可以是文本查詢,包括一個或多個搜索詞語(Term)或短語。搜索引擎例如可以通過文本相關的匹配方法返回與搜索查詢對應的搜索結果。
在實際搜索過程中,通過文本相關的匹配方法返回的結果往往與用戶的查詢需求不匹配,發生轉義。例如,用戶搜某明星A,搜索結果中可能包含“A座駕”相關的文本;搜“中國國旗”,可能出來“海里有掛滿中國國旗的漁船”的結果。
現有的文本匹配方案主要有:查詢與搜索結果文本的共有部分占查詢以及搜索結果的比例、BM25的相關性方式等。但是這些匹配方案無法解決上面提到的轉義問題。
發明內容
鑒于現有技術中的上述缺陷或不足,期望提供一種能夠有效解決搜索結果轉義問題的方案。
第一方面,本申請實施例提供了一種搜索引擎的實現方法。該方法包括:接收用戶輸入的查詢請求;獲取與查詢請求匹配的候選結果;基于點擊轉義模型確定查詢請求與每個候選結果之間的語義相關度; 以及根據語義相關度對候選結果進行排序;其中,點擊轉義模型包括轉義詞典和/或非轉義詞典,轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。
第二方面,本申請實施例還提供了一種搜索引擎,包括:接收單元,用于接收用戶輸入的查詢請求;搜索單元,用于搜索與所述查詢請求匹配的候選結果;語義相關度確定單元,用于基于點擊轉義模型確定所述查詢請求與每個候選結果之間的語義相關度;以及排序單元,用于根據所述語義相關度對候選結果進行排序。其中,點擊轉義模型包括轉義詞典和/或非轉義詞典,所述轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,所述非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。
本申請實施例提供的搜索引擎及其實現方法,通過基于點擊獲取與URL關聯的HTTP請求鏈,能夠得到較為全面的URL關聯的網頁內容,從而能夠對惡意網址進行準確檢測。按照本申請實施例的技術方案,根據語義相關度對搜索的候選結果進行排序,能夠提高搜索結果的排序效果,避免不符合用戶搜索需求的結果(也即轉義結果)出現在搜索結果列表的前列,從而確保用戶具有良好的使用體驗。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本申請的其它特征、目的和優點將會變得更明顯:
圖1示出了可以應用本申請實施例的示例性系統架構100;
圖2示出了根據本申請實施例的構建點擊轉義模型的方法的示例性流程圖;
圖3示出了根據本申請實施例的利用詞對齊獲取相鄰上下文的一個示例性實現;
圖4示出了根據本申請實施例的搜索引擎的實現方法的示例性流程圖;
圖5示出了根據本申請實施例的基于點擊轉義模型確定查詢請求 與候選結果之間的語義相關度的方法的示例性流程圖;
圖6示出了根據本申請實施例的對語句進行處理的結果的示意圖;
圖7示出了根據本申請實施例的基于點擊轉義模型調整分詞相似度權重的方法的一種示例性流程圖;
圖8示出了根據本申請實施例的搜索引擎的示例性結構框圖;以及
圖9示出了適于用來實現本申請實施例的服務器的計算機系統的結構示意圖。
具體實施方式
下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與發明相關的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
如背景技術中所提到的,在文本搜索中,通常會因為文本的局部匹配而導致轉義問題。例如,搜索蚊香,結果包含蚊香盒子;搜索手機,結果包含手機皮套;搜索常山,結果包含常山大白菜等。這種問題在利用文本搜索圖片中尤其明顯。例如,搜索“明星A”的圖片,結果包含:明星A攝影圖、明星A寫真高清圖片、明星A演唱會、明星A座駕等。這些結果里面,明星A座駕是轉義的結果,并非用戶真正想要的結果。
鑒于現有技術的上述缺陷,本申請實施例提供了一種按照語義轉義度對搜索結果進行排序的方案,以解決上述轉義問題。可以理解,通常在搜索過程所展現的結果中,點擊次數高的結果往往是用戶想要的結果。換言之,點擊次數高的結果相對于用戶的查詢Query而言不發生轉義的概率很高。與之相反,對于多次展現,但是點擊次數低甚 至無點擊的結果通常是用戶不想要的,也即這些結果相對于用戶的Query而言發生轉義的概率很高。另外,在對轉義的數據進行分析時發現,大多數的轉義都是發生在相鄰的上下文中,而對于距離較遠的上下文基本沒有影響。因此,基于上述分析提出了本申請諸實施例的搜索引擎的實現方法。
請參考圖1,其示出了可以應用本申請實施例的示例性系統架構100。
如圖1所示,系統架構100可以包括終端設備101、102、網絡103和服務器104。網絡103用以在終端設備101、102和服務器104之間提供通信鏈路的介質。網絡103可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶110可以使用終端設備101、102通過網絡103與服務器104交互,以訪問各種服務,例如搜索信息、瀏覽網頁、下載數據等。終端設備101、102上可以安裝有各種客戶端應用,例如可以接入統一資源定位符URL云服務的應用,包括但不限于瀏覽器、安全應用等。
終端設備101、102可以是各種電子設備,例如可以包括但不限于,各種可移動便攜設備,諸如智能手機、平板電腦、個人數字助理、電子書閱讀器等,以及各種固定式終端設備,諸如個人電腦、智能電視、查詢服務終端等。
服務器104可以是提供各種服務的服務器。服務器可以響應于用戶的服務請求而提供服務。可以理解,一個服務器可以提供一種或多種服務,同一種服務也可以由多個服務器來提供。在本申請的實施例中,所涉及的服務器104可以是搜索服務器。
應該理解,圖1中的終端設備、網絡和服務器的數目僅僅是示意性的。根據實現需要,可以具有任意數目的終端設備、網絡和服務器。
為了描述本申請實施例的搜索引擎的實現方法,首先描述本申請實施例中提出的點擊轉義模型的構建。如前面所分析的,點擊次數高的搜索結果相對于對應的查詢Query不發生轉義的概率高;而點擊次數低甚至無點擊的搜索結果相對于對應的Query發生轉義的概率高。另外,大多數的轉義都是發生在相鄰的上下文中,而對于距離較遠的 上下文基本沒有影響。因此,在本申請的實施例中,通過學習查詢請求與搜索結果(例如以網頁標題表示)Query-Title對的點擊數,同時考慮轉義發生的上下文來構建點擊轉義模型。具體而言,點擊轉義模型可以包括轉義詞典和/或非轉義詞典,其中轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。
圖2示出了根據本申請實施例的構建點擊轉義模型的方法的示例性流程圖。
如圖2所示,在步驟210中,獲取Query-Title對的點擊展現比。
點擊轉義模型可以通過學習歷史Query-Title對來構建。這些歷史Query-Title對可以保存在Query日志中。Query日志例如記錄了每次用戶查詢會話中所使用的查詢請求Query、展現的搜索結果以及用戶對搜索結果的點擊操作等。這些搜索結果例如可以用網頁標題Title來表征,因此,Query-Title對指的是查詢-搜索結果對。
可以對每個Query-Title對的展現情況和點擊情況進行統計,從而得到Query-Title對的點擊展現比。這里,點擊展現比為點擊數與展現數之比,其中展現數指示搜索結果Title響應于查詢請求Query而被展現的次數,點擊數指示搜索結果Title響應于查詢請求Query而展現時被用戶點擊的次數。
從前面分析可知,點擊次數高的搜索結果相對于對應的查詢Query不發生轉義的概率高,而點擊次數低甚至無點擊的搜索結果相對于對應的Query發生轉義的概率高。因此,Query-Title對的點擊展現比可以較好地表征Title相對于Query的轉義度或轉義概率。本領域技術人員可以理解,也可以使用諸如展現點擊比或構建基于點擊次數的其他參數來表征轉義度或轉義概率,本申請在此方面沒有限制。
接著,在步驟220中,利用詞對齊在搜索結果Title中獲取與查詢Query語句中詞語對齊的相鄰上下文。
對于每個Query-Title對,首先可以對Query和Title分別進行分詞。然后利用詞對齊,針對Query中的每個詞,找到其在Title中的對應位置。這里的詞對齊也包括同義對齊。例如,如果完全對應的詞沒 有出現,則考慮其同義詞。最后,在Title中獲取Query中首詞對齊和末詞對齊的相鄰上下文。
圖3示出了根據本申請實施例的利用詞對齊獲取相鄰上下文的一個示例性實現。在圖3的示例中,Query為“中國國旗”,Title為“海里有掛滿中國國旗的漁船”。
如圖3所示,分別對Query和Title進行分詞。具體的,Query分為“中國”和“國旗”;Title分為“海里”、“有”、“掛滿”、“中國”、“國旗”、“的”和“漁船”,在圖中用方框分隔各個詞語。
然后利用詞對齊,針對Query中的每個詞,找到其在Title中的對應位置。在圖3的示例中,Query中的每個詞“中國”和“國旗”均能在Title中找到完全對應的詞語,如圖中的箭頭所示。
最后,在Title中獲取Query中首詞對齊和末詞對齊的相鄰上下文。更具體的,獲取首詞對齊的相鄰上文和末詞對齊的相鄰下文。在此示例中,首詞“中國”的相鄰上文為“掛滿”,末詞“國旗”的相鄰下文為“的”,過濾掉停用詞“的”,繼續搜索后面的非停用詞作為下文,也即“國旗”的相鄰下文為“漁船”。
人類語言包含很多功能詞。與其他詞相比,功能詞沒有什么實際含義。最普遍的功能詞是限定詞(“這”、“這個”、“那”、“那些”、“the”、“a”、“an”、“that”、和“those”),這些詞幫助在文本中描述名詞和表達概念,如地點或數量。介詞如:“在…上”、“在..下”、“over”,“under”,“above”等表示兩個詞的相對位置。這些功能詞極其普遍,記錄這些詞在每一個文檔中的數量需要很大的磁盤空間。另外,由于它們的普遍性和功能,這些詞很少單獨表達文檔相關程度的信息。如果在檢索過程中考慮每一個詞而不是短語,這些功能詞基本沒有什么幫助。
在信息檢索中,這些功能詞的另一個名稱是:停用詞(stopword)。稱它們為停用詞是因為在文本處理過程中如果遇到它們,則立即停止處理,將其扔掉。將這些詞扔掉減少了索引量,增加了檢索效率,并且通常都會提高檢索的效果。停用詞主要包括英文字符、數字、數學字符、標點符號及使用頻率特高的單漢字等。
返回圖2,在步驟230中,基于點擊展現比相應地構建轉義詞典和/或非轉義詞典。具體而言,將點擊展現比低于第一閾值的Query-Title對中的對應詞語及其上下文加入轉義詞典中;和/或將點擊展現比高于第二閾值的Query-Title對中的對應詞語及其上下文加入非轉義詞典中。第一閾值可以與第二閾值相同或不同。
針對歷史Query-Title對中的每條Query-Title對執行圖2所示的處理,累加所有點擊展現比低于第一閾值的Query-Title對中的詞語以及合并對應的上下文,可以建立轉義詞典;累加所有點擊展現比高于第二閾值的Query-Title對中的詞語以及合并對應的上下文,可以建立非轉義詞典。由于上述轉義詞典和非轉義詞典的生成過程中,未對Query中的詞語進行擴展,因此這里生成的轉義詞典也可以稱為原生轉義詞典,相應的非轉義詞典可以稱為原生非轉義詞典。
可選的或附加的,在一些實施例中,為了將統計的上下文推廣到更大的范圍,可以通過對Query中的詞語的語義類別進行泛化,來生成泛化轉義詞典和/或泛化非轉義詞典。
在這些實施例中,可以對Query中的詞語進行語義類別標注,從而通過詞語的語義類別進行泛化。例如,如果詞語為某明星A的名字,則可以標注其語義類別為明星;如果詞語為九寨溝,則可以標注其語義類別為景點。通過語義類別標注,可以將一些實體的詞語用語義類別來代替。
可以采用多種方式對詞語進行語義類別標注,例如,可以采用通用的最大熵分類器對詞語進行分類識別。語義類別例如可以包括但不限于以下類別:娛樂明星、體育明星、科技人物、景點、影視、汽車、動漫、動物、植物,等等。
接著,可以利用所標注的語義類別來構建與原生轉義詞典和原生非轉義詞典對應的泛化轉義詞典和泛化非轉義詞典。在一種實現中,可以簡單地將原生轉義詞典/原生非轉義詞典中的原詞替換為泛化的語義類別,從而生成泛化轉義詞典/泛化非轉義詞典。
前面描述了本申請實施例的點擊語義模型的構建,下面將結合流程圖來描述基于點擊語義模型改善搜索引擎的搜索結果的方案。
圖4示出了根據本申請一個實施例的搜索引擎的實現方法的示例性流程圖。圖4所示的方法可以由搜索引擎所在的服務器(例如圖1的服務器104)執行。
如圖4所示,在步驟410中,接收用戶輸入的查詢請求。
用戶可以通過各種終端設備(例如圖1所示的終端設備101、102)進行搜索查詢。這些終端設備可以向用戶呈現用戶界面(例如,瀏覽器界面)以輸入查詢請求。用戶可以經由各種輸入工具,例如觸控屏、手寫筆、鍵盤、麥克風等來輸入查詢請求。查詢請求可以是文本查詢、語音查詢或其他類型的查詢。如果查詢請求為非文本查詢,則可以采用各種適當的技術,諸如光學字符識別OCR、語音識別等,將文本查詢轉換為文本查詢。繼而,終端設備可以將原始接收的或者經轉換的查詢請求發送給搜索服務器(例如,圖1的服務器104)。
接著,在步驟420中,搜索與所接收的查詢請求匹配的候選結果。
可以采取多種方式來搜索與查詢請求匹配的候選結果。在一些實現中,可以使用文本匹配,例如詞匹配的方法來搜索與查詢請求匹配的候選結果。詞匹配方法的一些常用算法例如可以包括,BM25(Best Match,最佳匹配)算法、proximity(Term proximity scoring,詞近鄰得分)算法等。通過詞匹配算法計算所搜索文檔與查詢請求的匹配程度,繼而可以基于匹配程度給出與查詢請求匹配的候選結果。上述搜索方法可以使用目前已知的各種算法來實現,此處不再贅述。
繼而,在步驟430中,基于點擊轉義模型確定查詢請求與每個候選結果之間的語義相關度。
在實際檢索中,對與查詢請求匹配的候選結果,通常選取一定數量的候選結果進行細化處理。例如,可以選取2000個候選結果,分析這些結果中每個候選結果與查詢請求的語義相關度。
如前面結合圖2和圖3所描述的,點擊轉義模型通過學習查詢請求與搜索結果Query-Title對的點擊數,同時考慮轉義發生的上下文來構建。具體而言,點擊轉義模型可以包括轉義詞典和/或非轉義詞典,其中轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。
因此,基于點擊轉義模型確定的語義相關度考慮了Query-Title對的點擊數,還考慮了轉義發生的上下文,從而所確定的語義相關度可以準確地表示候選結果相對于查詢請求的轉義概率。基于點擊轉義模型確定語義相關度的詳細方法將在下文描述。
最后,在步驟440中,根據語義相關度對候選結果進行排序。
本步驟中,可以按照每個候選結果與查詢請求的語義相關度由高至低的順序,對搜索得到的候選結果進行排序和顯示,使得顯示在前的始終為與查詢請求較相關的搜索結果,從而使得用戶可以從顯示的搜索結果中快速獲得更想要的關聯文檔,滿足自己的搜索需求,提高搜索效率。可以理解的是,本步驟也可以根據需要采用其他順序進行排序處理。
圖5示出了根據本申請實施例的基于點擊轉義模型確定查詢請求與候選結果之間的語義相關度的方法的示例性流程圖。也即,圖5示出了圖4中的步驟430的一個示例性實現。
如圖5所示,在步驟510中,確定查詢請求與候選結果的一個或多個語句之間的語義相關度。
候選結果也即各種網頁信息,其可以使用文檔(document)來表示。通常而言,文檔由多個語句組成,其從結構上劃分例如可以包括標題(Title)、錨文本(Anchor text)和正文等。標題簡單、精煉地描述了文檔的主題。錨文本又稱錨文本鏈接,是鏈接的一種形式,和超鏈接類似,把關鍵詞做一個鏈接,指向別的網頁,這種形式的鏈接就叫作錨文本。錨文本實際上是建立了文本關鍵詞與URL鏈接的關系。正文通常會包括較多內容。
由于候選結果通常具有較多語句,因此,可以分別確定查詢請求與候選結果的一個或多個語句之間的語義相關度。這些語句例如可以選自:標題、錨文本、正文中的核心句子等。正文中的核心句子可以采取現有技術中已知或未來開發的多種方式來確定。在一種實現中,可以認為正文中的首句為其核心句子。
接著,在步驟520中,根據所確定的查詢請求與候選結果的一個或多個語句之間的語義相關度來確定查詢請求與該候選結果之間的語 義相關度。
可以通過多種方式來確定查詢請求與候選結果之間的最終語義相關度。在一種實現中,可以從所確定的多個語義相關度中選擇其最大值作為查詢請求與該候選結果之間的語義相關度。在另一種實現中,可以將所確定的多個語義相關度的平均值作為查詢請求與該候選結果之間的語義相關度。本領域技術人員可以理解,也可以使用其他函數關系、基于所確定的多個語義相關度來確定查詢請求與該候選結果的最終語義相關度,本申請在此方面沒有限制。
步驟510進一步示出了根據本申請實施例的在確定查詢請求與候選結果的某一語句之間的語義相關度的方法的示例性實現。在此實現中,語義相關度主要由兩部分組成:語句之間的主題匹配相似度以及語句之間的轉義因子。
具體的,在步驟511中,基于預先構建的點擊轉義模型,利用句子間的文本主題匹配模型計算查詢請求與候選結果的語句之間的主題匹配相似度。
兩個語句之間的主題匹配相似度可以采取多種度量方式來表征。在一些實現中,可以采用統一框架的向量空間模型相似度計算方法來計算語句之間的主題匹配相似度。
例如,兩個句子可以分別用S1,S2表示如下:
S1={(w111,w112...w11k),(w121,w122...w12k),...,(w1m1,w1m2...w1mk)}---(1)]]>
S2={(w211,w212...w21k),(w221,w222...w22k),...,(w2n1,w2n2...w2nk)}---(2)]]>
上述公式中,將句子進行分詞,例如第一個句子S1分成m個詞,第二個句子S2分成n個詞。對分出來的詞進行詞性標注,從而在各個分詞位置上得到一個詞集合。例如,第一個句子S1的分詞位置w1i上的詞集合為該詞集合包括分詞位置w1i對應的原詞、相關詞和小粒度組成部分。
在本文中,相關詞是指與原詞的語義相同的詞語(或稱同義詞)或語義相近的詞語,其統稱為相關詞。可以采用多種方式來挖掘原詞的相關詞,例如基于Query-Title點擊對。上述挖掘相關詞的方法可以使用目前已知的各種方案來實現,此處不再贅述。
將句子表示為空間向量之后,可以采取多種度量方式來計算兩個向量之間的相似性,也即語句之間的主題匹配相似度。這些度量方式包括但不限于,余弦距離或稱余弦相似度,歐式距離,皮爾森Pearson相關系數法或修正的Pearson相關系數法。這些計算相似度或相關性的方法在本領域中是已知的。以下僅以余弦距離為例進行闡述。
余弦距離是用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小的度量。例如可以按下式計算兩個語句之間的主題匹配相似度:
Sim(S1,S2)=Σw1ki=w2kj(Wgt(w1ki)*Wgt(w2kj))Σt=1...mWgt(w1kt)2Σj=1...nWgt(w2kj)2*SentType(S1,S2)---(3)]]>
表示詞的相似度權重,SentType(S1,S2)表示兩個句子是否匹配所對應的權重系數,如果兩個句子S1,S2問句類型匹配,則對應的權重系數為第一值,例如1,否則為第二值,例如0.8。
以下結合一個具體的實例來描述如何計算兩個語句之間的主題匹配相似度。假設第一個句子S1為“華中科技大學在湖北武漢哪個地方”,第二個句子S2為“華科大在武漢市什么位置”。
首先對這兩個句子分別進行分詞處理和詞性標注。為了簡單起見,在此示例中未示出詞性標注。S1得到的分詞結果為:“華中科技大學”、“在”、“湖北”、“武漢”、“哪個地方”。其中,“華中科技大學”對應的更小分詞粒度的詞語為“華中”、“科技”、“大學”;“哪個地方”對應的更小分詞粒度的詞語為“哪個”、“地方”。S2得到的分詞結果為:“華科大”、“在”、“武漢市”、“什么位置”。其中“什么位置”對應的更小分詞粒度的詞語為“什么”、“位置”。
對分詞后得到的各詞語賦予權值。可選的或附加的,還對語句中語義冗余詞語進行識別,并對冗余的詞語進行降權。語義冗余詞語識別可以使用各種現在已知或未來開發的技術來實現,本申請在此方面沒有限制。在進行語義冗余詞語的識別后,例如確定第一個句子中的“湖北”為語義冗余的詞語,對其進行降權。
然后將存在語義映射的詞語映射為歸一化的表述。具體而言,確定第一個句子S1中“華中科技大學”映射為“華中科技大學”,“武漢” 映射為“武漢”,“哪個地方”映射為“哪里”。第二個句子S2中“華科大”映射為“華中科技大學”,“武漢市”映射為“武漢”,“什么位置”映射為“哪里”。
此外,對兩個句子的問句類型進行匹配。由于疑問詞“哪個”與其上下文出現的名詞“地方”對應的問句類型為“地點”,疑問詞“什么”與其上下文出現的名詞“位置”對應的問句類型為“地點”,因此可以識別出問句S1和S2屬于相同的問句類型,從而可以確定權重系數SentType(S1,S2)取第一值,例如1。
圖6示出了對語句進行上述處理的結果的示意圖。
如圖6所示,在第一個句子S1中,“華中科技大學”、“華中”、“科技”、“大學”對應第一個語義映射位,“湖北”對應第二個語義映射位,“武漢”對應第三個語義映射位,“哪個地方”、“哪個”、“地方”對應第四個語義映射位。在第二個句子S2中,“華科大”對應第一個語義映射位,“武漢市”對應第二個語義映射位,“什么位置”、“什么”、“位置”對應第三個語義映射位。
由于“華中科技大學”和“華科大”映射到相同的歸一化表述,因此“華中科技大學”和“華科大”為匹配成功的詞語。“在”是停用詞,將其忽略,不參與計算。“武漢”和“武漢市”映射為相同的歸一化表述,因此“武漢”和“武漢市”也是匹配成功的詞語。“哪個地方”和“什么位置”映射為相同的歸一化表述,因此“哪個地方”和“什么位置”也是匹配成功的詞語。
按照上面給出的公式(3)可以計算兩個句子之間的主題匹配相似度:

在本申請實施例中,基于預先構建的點擊轉義模型,利用句子間的文本主題匹配模型計算查詢請求與候選結果的語句之間的主題匹配相似度可以表現為:利用點擊轉義模型來調整候選結果的語句中的某 些詞的相似度權重。
詞的初始相似度權重可以利用文本挖掘領域的已知技術來分配。可以有多重分配權重的方式,常用的例如包括TF-IDF(term frequency–inverse document frequency)。
TF-IDF是一種用于信息搜索和信息挖掘的常用加權技術。在搜索、文獻分類和其他相關領域有廣泛的應用。TF-IDF的主要思想是,如果某個詞或短語在一篇文章中出現的頻率TF高,并且在其他文章中很少出現,則認為此詞或者短語具有很好的類別區分能力,適合用來分類。TF詞頻(Term Frequency)指的是某一個給定的詞語在該文件中出現的次數。IDF反文檔頻率(Inverse Document Frequency)的主要思想是:如果包含詞條的文檔越少,IDF越大,則說明詞條具有很好的類別區分能力。使用TF和IDF可以計算某個關鍵字在某篇文章里面的重要性。可以基于TF和IDF,利用各種函數關系來構造詞語的權重。
在一些實現中,詞語的初始權重可以按下式計算:
Wgtini(w1ki)=(logTF(w1ki)+1)*logIDF(w1ki)=(logTF(w1ki)+1)*log(N/DF(w1ki))---(4)]]>
其中為分詞的詞頻,其可以表示為分詞在該文檔中出現的次數與該文檔分詞的總數之比;為分詞的反文檔頻率,N為總文檔數,出現分詞的文檔數。
在本申請的一些實施例中,對各語句中的分詞確定初始權重之后,可以對候選結果的語句中的某些分詞的相似度權重基于點擊轉義模型進行調整。
圖7示出了根據本申請實施例的基于點擊轉義模型調整分詞相似度權重的方法的一種示例性流程圖。
如圖7所示,在步驟710中,利用詞對齊從候選結果的語句中確定與查詢請求中的詞語對齊的相鄰上文和下文。該步驟與前面結合圖2描述的構建點擊轉義模型的步驟220類似,此處不再贅述。
接著,在步驟720中,根據轉義詞典和/或非轉義詞典調整候選結果的語句中的對應上文和下文的相似度權重。
在此步驟中,針對識別出的相鄰上文和相鄰下文,可以查找轉義詞典和非轉義詞典,以對這些相鄰上文和相鄰下文的相似度權重進行 調整。
具體而言,若非轉義詞典中包括候選結果的語句中的對應詞語及其相鄰上文或相鄰下文,則降低該相鄰上文或相鄰下文的相似度權重。若轉義詞典中包括候選結果的語句中的對應詞語及其相鄰上文或相鄰下文,則調高該相鄰上文或相鄰下文的相似度權重。如果非轉義詞典和轉移詞典中都未找到對應詞語及其相鄰上文或相鄰下文,則可以不調整其相似度權重。
例如,查詢語句為“中國國旗”,候選結果為“海里有掛滿中國國旗的漁船”,相鄰上文為“掛滿”,相鄰下文為“漁船”。針對詞語“中國”和相鄰上文“掛滿”,可以首先在原生轉義詞典和非轉義詞典中進行查找。如果原生非轉義詞典中有“中國,掛滿”,則可以降低“掛滿”的相似度權重,從而提高主題匹配相似度。如果原生轉義詞典和非轉義詞典中都沒有“中國,掛滿”,可以繼續查找泛化轉義詞典和非轉義詞典。如果在泛化非轉義詞典中查到“【地名】,掛滿”,則同樣可以對“掛滿”進行降權處理,也即降低“掛滿”的相似度權重,從而提高主題匹配相似度。針對詞語“國旗”和相鄰下文“漁船”可以基于同樣的思路進行處理,此處不再贅述。
在對詞語的相似度權重基于點擊轉義模型進行調整之后,可以利用上面描述的句子間的文本主題匹配模型來計算查詢請求與候選結果的語句之間的主題匹配相似度。
例如,可以按如下公式計算查詢請求與候選結果的語句之間的主題匹配相似度:
Sin(Q,S)=Σw1k=w2l(Wgt(w1k)*Wgt(w2l))Σk=1...MWgt(w1k)2Σl=1...NWgt(w2l)2*SentType(Q,S)---(5)]]>
其中,Sim(Q,S)表示Q和S之間的主題匹配相似度,Q表示查詢請求,S表示候選結果的語句,SentType(Q,S)表示兩個句子類型匹配的權重系數,Wgt(w1k)表示從查詢請求中得到的詞w1k的相似度權重,M為詞w1k的數量,Wgt(w2l)表示從候選結果的語句中得到的詞w2l的相似度權重,N為詞w2l的數量,其中候選結果的語句中的某些詞(例如相鄰上文和/或相鄰下文基于點擊轉義模型進行了調整)。
繼續圖5,在步驟512中,根據查詢請求與候選結果的語句之間的匹配狀況確定轉義因子。
在步驟511確定句子間的主題匹配相似度時,從微觀上考慮,基于點擊轉義模型對具體的詞語的相似度權重進行了調整。在此步驟512中,根據查詢請求與候選結果的語句之間的匹配狀況,也即從宏觀上考慮來確定一個轉義因子。
查詢請求與候選結果的語句之間的匹配狀況例如可以包括:查詢請求中最重要的詞語沒有在候選結果的語句中出現、存在上下文的匹配以及不存在上下文的完全匹配。
當查詢請求中最重要的詞語沒有在候選結果的語句中出現時,這通常表明二者之間的相關性較低,以及轉義的可能性較高。此時,可以將轉義因子確定為第一值,例如0.7。查詢請求中的詞語的重要性可以基于前面確定的相似度權重來確定。例如,可以直接根據TF-IDF技術確定的權重來確定。
存在上下文的匹配是指除了詞語的字面匹配之外,候選結果中還存在與該詞語的相鄰上文或相鄰下文。換言之,此時候選結果也存在轉義的可能性。因此,可以將轉義因子確定為第二值,第二值大于第一值,例如為0.95。
不存在上下文的完全匹配是指除了詞語的字面匹配之外,候選結果中不存在該詞語的相鄰上文和相鄰上文。換言之,此時候選結果基本上不存在轉義的可能性。因此,可以將轉義因子確定為第三值,第三值大于第二值,例如為1。
最后,在步驟513中,基于轉義因子和主題匹配相似度計算查詢請求與候選結果的語句之間的語義相關度。
基于轉義因子和主題匹配相似度,可以根據多種函數關系來構建語義相關度。在一種實現中,可以按下式計算查詢請求與候選結果的語句之間的語義相關度:
Rele(Q,S)=β(Q,S)Sim(Q,S)
其中,Rele(Q,S)表示Q和S之間的語義相關度,β(Q,S)表示Q和S之間的轉義因子,Sim(Q,S)表示Q和S之間的主題匹配相似度,Q表 示查詢請求,S表示候選結果的語句。
應當注意,盡管在附圖中以特定順序描述了本發明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執行這些操作,或是必須執行全部所示的操作才能實現期望的結果。相反,流程圖中描繪的步驟可以改變執行順序。附加地或備選地,可以省略某些步驟,將多個步驟合并為一個步驟執行,和/或將一個步驟分解為多個步驟執行。
進一步參考圖8,其示出了根據本申請實施例的搜索引擎的示例性結構框圖。
如圖8所示,搜索引擎800包括接收單元810、搜索單元820、語義相關度確定單元830和排序單元840。
接收單元810可以配置用于接收用戶輸入的查詢請求。搜索單元820可以配置用于搜索與查詢請求匹配的候選結果。語義相關度確定單元830可以配置用于基于點擊轉義模型確定查詢請求與每個候選結果之間的語義相關度。排序單元840可以配置用于根據語義相關度對候選結果進行排序。其中,點擊轉義模型包括轉義詞典和/或非轉義詞典,轉義詞典包括確定發生轉義的搜索結果的對應詞語及其上下文,非轉義詞典包括確定未發生轉義的搜索結果的對應詞語及其上下文。
在一些實施例中,語義相關度確定單元830可以包括:計算單元831,用于針對每個候選結果,確定查詢請求與候選結果的一個或多個語句之間的語義相關度,其中語句包括以下至少一項:候選結果的標題、錨文本和正文中的核心句子。語義相關度確定單元830還可以包括確定單元832,用于根據所確定的查詢請求與候選結果的一個或多個語句之間的語義相關度確定查詢請求與候選結果之間的語義相關度。
在一些實現中,計算單元831可以包括:主題匹配相似度模塊(未示出),用于基于點擊轉義模型,利用句子間的文本主題匹配模型計算查詢請求與候選結果的語句之間的主題匹配相似度。
主題匹配相似度模塊具體可以用于:利用詞對齊從候選結果的語句中確定與查詢請求中的詞語對齊的相鄰上文和下文;根據轉義詞典 和/或非轉義詞典調整候選結果的語句中的對應上文和下文的相似度權重;以及根據調整后的相似度權重,利用句子間的文本主題匹配模型計算查詢請求與候選結果的語句之間的主題匹配相似度。
計算單元831還可以包括:轉義因子模塊(未示出),用于根據查詢請求與候選結果的語句之間的匹配狀況確定轉義因子。
轉義因子模塊具體可以用于:若匹配狀況為查詢請求中最重要的詞語沒有在候選結果的語句中出現,則轉義因子確定為第一值;若匹配狀況為存在上下文的匹配,則轉義因子確定為第二值;若匹配狀況為不存在上下文的完全匹配,則轉義因子確定為第三值,其中,第一值小于第二值,并且第二值小于第三值。
計算單元831還可以包括:合成模塊(未示出),用于基于轉義因子和主題匹配相似度計算查詢請求與候選結果的語句之間的語義相關度。
在一些實施例中,點擊轉義模型中的轉義詞典和非轉義詞典通過學習查詢請求與搜索結果Query-Title對的點擊數而構建。
在一些實現中,轉義詞典和非轉義詞典包括通過如下方法而構建的原生轉義詞典和原生非轉義詞典:獲取Query-Title對的點擊展現比,點擊展現比為點擊數與展現數之比,展現數指示搜索結果響應于查詢請求而被展現的次數,點擊數指示搜索結果響應于查詢請求而展現時被用戶點擊的次數;利用詞對齊在搜索結果中獲取與查詢語句中詞語對齊的相鄰上下文;將點擊展現比低于第一閾值的Query-Title對中的對應詞語及其上下文加入原生轉義詞典中;以及將點擊展現比高于第二閾值的Query-Title對中的對應詞語及其上下文加入原生非轉義詞典中。
可選的或附加的,轉義詞典和非轉義詞典還包括通過如下方法而構建的泛化轉義詞典和泛化非轉義詞典:對查詢請求中的詞語標注語義類別;以及利于所標注的語義類別構建與原生轉義詞典和原生非轉義詞典對應的泛化轉義詞典和泛化非轉義詞典。
應當理解,搜索引擎800中記載的諸單元或子單元與前面參考方法流程圖描述的方法中的各個步驟相對應。由此,上文針對方法描述 的操作和特征同樣適用于搜索引擎800及其中包含的單元,在此不再贅述。
下面參考圖9,其示出了適于用來實現本申請實施例的服務器的計算機系統900的結構示意圖。
如圖9所示,計算機系統900包括中央處理單元(CPU)901,其可以根據存儲在只讀存儲器(ROM)902中的程序或者從存儲部分908加載到隨機訪問存儲器(RAM)903中的程序而執行各種適當的動作和處理。在RAM 903中,還存儲有系統900操作所需的各種程序和數據。CPU 901、ROM 902以及RAM 903通過總線904彼此相連。輸入/輸出(I/O)接口905也連接至總線904。
以下部件連接至I/O接口905:包括鍵盤、鼠標等的輸入部分906;包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分907;包括硬盤等的存儲部分908;以及包括諸如LAN卡、調制解調器等的網絡接口卡的通信部分909。通信部分909經由諸如因特網的網絡執行通信處理。驅動器910也根據需要連接至I/O接口905。可拆卸介質911,諸如磁盤、光盤、磁光盤、半導體存儲器等等,根據需要安裝在驅動器910上,以便于從其上讀出的計算機程序根據需要被安裝入存儲部分908。
特別地,根據本公開的實施例,上文參考圖2-圖7描述的過程可以被實現為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產品,其包括有形地包含在機器可讀介質上的計算機程序,所述計算機程序包含用于執行圖2-圖7的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分909從網絡上被下載和安裝,和/或從可拆卸介質911被安裝。
附圖中的流程圖和框圖,圖示了按照本發明各種實施例的系統、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發 生。例如,兩個接連地表示的方框實際上可以基本并行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或操作的專用的基于硬件的系統來實現,或者可以用專用硬件與計算機指令的組合來實現。
描述于本申請實施例中所涉及到的單元或模塊可以通過軟件的方式實現,也可以通過硬件的方式來實現。所描述的單元或模塊也可以設置在處理器中,這些單元或模塊的名稱在某種情況下并不構成對該單元或模塊本身的限定。
作為另一方面,本申請還提供了一種計算機可讀存儲介質,該計算機可讀存儲介質可以是上述實施例中所述裝置中所包含的計算機可讀存儲介質;也可以是單獨存在,未裝配入設備中的計算機可讀存儲介質。計算機可讀存儲介質存儲有一個或者一個以上程序,所述程序被一個或者一個以上的處理器用來執行描述于本申請的公式輸入方法。
以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本申請中所涉及的發明范圍,并不限于上述技術特征的特定組合而成的技術方案,同時也應涵蓋在不脫離所述發明構思的情況下,由上述技術特征或其等同特征進行任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術特征進行互相替換而形成的技術方案。

關 鍵 詞:
搜索引擎 及其 實現 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:搜索引擎及其實現方法.pdf
鏈接地址:http://www.wwszu.club/p-6373789.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大