鬼佬大哥大
  • / 12
  • 下載費用:30 金幣  

一種知識的檢索方法.pdf

摘要
申請專利號:

CN201510284563.2

申請日:

2015.05.28

公開號:

CN104915396A

公開日:

2015.09.16

當前法律狀態:

撤回

有效性:

無權

法律詳情: 發明專利申請公布后的視為撤回IPC(主分類):G06F 17/30申請公布日:20150916|||實質審查的生效IPC(主分類):G06F 17/30申請日:20150528|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 杭州電子科技大學
發明人: 蘇少輝; 李鵬飛; 徐匡; 黃成毅; 曾垂遠; 吳凡超
地址: 310018浙江省杭州市下沙高教園區2號大街
優先權:
專利代理機構: 浙江杭州金通專利事務所有限公司33100 代理人: 王佳健
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510284563.2

授權公告號:

||||||

法律狀態公告日:

2018.08.28|||2015.10.14|||2015.09.16

法律狀態類型:

發明專利申請公布后的視為撤回|||實質審查的生效|||公開

摘要

本發明公開了一種知識的檢索方法。本發明認為檢索的匹配性高必須較全面表達知識的結構和語義,綜合語義距離和語義屬性計算相似性,為此,提出了基于本體的知識表示流程和基于本體的知識檢索模型以及算法。本發明通過將提出的基于本體的檢索算法配合應用在所提出的檢索模型中,針對概念的語義距離和概念屬性進行相似性計算,使得出的結果更加接近用戶需求,挺高了檢索的效率和知識的重用。

權利要求書

權利要求書
1.  一種知識的檢索方法,該檢索方法基于的檢索模型分為三個層次:人機交互層、資源層和檢索匹配層,在檢索過程中需要本體庫的支撐;
所述的人機交互層主要實現用戶與計算機之間的語言交流;用戶輸入需要查詢的內容到用戶界面上,計算機發出檢索請求;用戶的檢索請求多種多樣,為了使計算機能夠準確識別,需要根據本體庫的知識分析用戶的真實檢索意圖,進而使檢索請求標準化,進一步轉向檢索匹配層進行檢索請求的預處理;人機交互層面上還有一個功能就是對檢索結果的處理,合成用戶所需要的檢索結果;
所述資源層主要是收集知識源;通過本體庫中的相關知識對收集的知識有一個語義上的分析和標注,因此可以建立相應的索引信息放入索引庫內,并且已標注的知識能夠補充和完善本體庫;在模型中運行過程是將本體庫中的相關知識應用到檢索請求分析和檢索請求預處理,對檢索內容的語義標注和檢索內容的語義擴展,對檢索內容和索引庫的匹配,以及對檢索結果的排序、再處理和合成;
所述檢索匹配層是整個檢索流程的關鍵;首先對檢索請求進行預處理,使檢索請求信息規范化和標準化;然后通過本體知識對檢索內容進行語義標注,使計算機能夠充分識別檢索內容,并且在本體知識的作用下對已標注的語句進行語義上同義詞或近義詞的擴展;進而根據本體庫中的相關知識對檢索內容進行相應的語法匹配和語義匹配;最后根據相關程度對檢索結果進行排序處理,將檢索結果呈現給用戶;
其特征在于該方法包括以下步驟:
步驟1.用戶輸入所需要檢索的請求,系統提取檢索請求概念,并將這些概念設定為一個用戶概念集,定義這個用戶概念集為A,其中A={A1,A2,A3,…,An},并按概念的權值由高到低的順序進行排序;
步驟2.利用本體映射概念將用戶概念集A映射為過渡概念集a={a1,a2,a3,…,an},其映射關系如下表所示,并將過渡概念集a整理后得到對應的本體概念集B={B1,B2,B3,…,Bn},整理得到的映射后相對應的概念的權值不變;

步驟3.將本體概念集B中的每一個概念Bi按權值的高低進行語義相似度計算,計算在知識本體中語義相似度Sim(ci,ck)≥λ(i,k∈(1,n),λ為相似度閾值)的概念,其中得到新的檢索需求概念空間,把它稱為本體核心概念集,記為C={C1,C2,C3,…,CK},其中(1,k)∈(1,n);
其中的基于語義距離相似度Sim(ci,ck)計算公式為:
Sim(ci,ck)=[w×(dl(ci)+dl(ck))][max(Dist(ci,ck),w)×2×maxdl×max(|dl(ci)-dl(ck)|,1)]]]>
其中,dl(ci)和dl(ck)分別是概念ci、ck在領域本體中所處的層次;Dist(ci,ck)是本體樹型中概念ci、ck之間的最小路徑;maxdl是指本體樹型中深度最大值;w是一個權值,w≥0;
步驟4.將本體核心概念集C與知識庫進行語義匹配,進行基于屬性相似度計算,計算相似度Sim(cj,cl)≥θ(j,l∈(1,k),θ為相似度閾值)的概念,得到知識解集D,記D={D1,D2,D3,…,Di},其中(1,i)∈(1,k);
其中的基于屬性相似度Sim(ci,ck)計算公式為:
Sim(cj,cl)=Count(Attr(cj)Attr(cl))Count(Attr(cj)Attr(cl))]]>
其中,Attr(cj)和Attr(cl)分別表示概念cj、cl的屬性集,Attr(cj)∩Attr(cl)表示兩概念集具有相同屬性的集合,Attr(cj)∪Attr(cl)表示兩概念所有屬性的集合,Count()表示相應集合中屬性的數量;
步驟5.對得出的知識解集進行相應的條件判定,如果不為空集,那么再計算用戶概念集B和知識解集D的綜合相似度;如果為空集,那么就重新回到本體映射概念,并且增大相似度的范圍,使得可能性更大;根據整體相似度的計算結果大小將匹配成功的知識從高到低依次排列出來,并呈現在系統界面上;
其中綜合相似度Sim(cx,cy)計算公式為:
Sim(cx,cy)=α×Sim(ci,ck)+β×Sim(cj,cl)
其中,相似度Sim(ci,ck)和Sim(cj,cl)分別代表基于語義相似度值和基于屬性相似度值;α和β是相似度權重,α+β=1,概念集范圍x,y∈(1,i)。

關 鍵 詞:
一種 知識 檢索 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種知識的檢索方法.pdf
鏈接地址:http://www.wwszu.club/p-6373450.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大