鬼佬大哥大
  • / 13
  • 下載費用:30 金幣  

基于網頁鏈接分析和支持向量機的網頁文本分類算法研究.pdf

關 鍵 詞:
基于 網頁 鏈接 分析 支持 向量 文本 分類 算法 研究
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201510287308.3

申請日:

2015.05.29

公開號:

CN105205090A

公開日:

2015.12.30

當前法律狀態:

實審

有效性:

審中

法律詳情: 實質審查的生效IPC(主分類):G06F 17/30申請日:20150529|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 湖南大學
發明人: 王冰; 陳浩
地址: 410012 湖南省長沙市岳麓區麓山南路麓山門
優先權:
專利代理機構: 北京科億知識產權代理事務所(普通合伙) 11350 代理人: 湯東鳳
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510287308.3

授權公告號:

|||

法律狀態公告日:

2016.01.27|||2015.12.30

法律狀態類型:

實質審查的生效|||公開

摘要

本發明公開了基于網頁鏈接分析和支持向量機的網頁文本分類算法研究,它涉及網頁分類技術領域,它的具體步驟為:(一)把大量網頁分為訓練集和測試集兩部分;(二)對網頁(包括訓練集和測試集)進行預處理;(三)計算訓練集中每個網頁內特征詞的詞頻;(四)計算出訓練集中每個網頁內特征詞的權重;(五)計算測試集中每個類的特征向量;(六)計算訓練集中每個網頁的文本特征向量;(七)確定相似度最小值為閥值;(八)最大程度減少特征詞的數量;(九)對測試集網頁的文本特征向量進行分類;(十)同時計算測試網頁分類后與此類特征向量的相似度。它利用空間向量模型和支持向量機的方法,具有分類時間短,召回率高,內存需求少,學習速度快的特點。

關于本文
本文標題:基于網頁鏈接分析和支持向量機的網頁文本分類算法研究.pdf
鏈接地址:http://www.wwszu.club/p-6405720.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大 773403186706240932256403227772341508416268061977577026772176646131877400935854260233508980348925688 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();