鬼佬大哥大
  • / 19
  • 下載費用:30 金幣  

網頁修復方法、終端、服務器及系統.pdf

關 鍵 詞:
網頁 修復 方法 終端 服務器 系統
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201510342371.2

申請日:

2015.06.18

公開號:

CN104899320A

公開日:

2015.09.09

當前法律狀態:

駁回

有效性:

無權

法律詳情: 發明專利申請公布后的駁回IPC(主分類):G06F 17/30申請公布日:20150909|||實質審查的生效IPC(主分類):G06F 17/30申請日:20150618|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 安一恒通(北京)科技有限公司
發明人: 郭俊杰; 陳慶偉; 李華岡
地址: 100091北京市海淀區東北旺西路8號中關村軟件園4號樓C座1-03
優先權:
專利代理機構: 北京英賽嘉華知識產權代理有限責任公司11204 代理人: 王達佐; 馬曉亞
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510342371.2

授權公告號:

||||||

法律狀態公告日:

2019.05.17|||2015.10.07|||2015.09.09

法律狀態類型:

發明專利申請公布后的駁回|||實質審查的生效|||公開

摘要

本申請公開了網頁修復方法、終端、服務器及系統。網頁修復方法的一具體實施方式包括:如果當前訪問的網頁為失效網頁,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁;接收快照服務器反饋的匹配的網頁;向智能服務器發送匹配的網頁,以供智能服務器對所述匹配的網頁進行安全過濾;檢測從智能服務器接收的過濾后的網頁內容中是否包含有效信息;如果從智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。該實施方式通過對失效網頁進行快照查找和安全過濾,獲取失效網頁的信息,提升了瀏覽器獲取信息的能力,并且可以保證所獲取的信息安全有效。

權利要求書

權利要求書
1.  一種網頁修復方法,其特征在于,所述方法包括:
如果當前訪問的網頁為失效網頁,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁;
接收所述快照服務器反饋的匹配的網頁;
向智能服務器發送所述匹配的網頁,以供所述智能服務器對所述匹配的網頁進行安全過濾;
檢測從所述智能服務器接收的過濾后的網頁內容中是否包含有效信息;以及
如果從所述智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。

2.  根據權利要求1所述的方法,其特征在于,所述快照請求信息至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間。

3.  根據權利要求1或2所述的方法,其特征在于,所述方法還包括:
響應于用戶修復網頁的操作,對網頁進行修復。

4.  一種網頁修復方法,其特征在于,所述方法包括:
接收終端發送的快照請求信息;
基于所述快照請求信息查找匹配的網頁;以及
將查詢結果發送至終端,以供終端將所述匹配的網頁發送至智能服務器進行安全過濾。

5.  根據權利要求4所述的方法,其特征在于,所述快照請求信息至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間;
所述基于所述快照請求查找匹配的網頁,包括:
在已存儲的網頁中查詢與所述當前訪問的網頁的URL相同且保 存時間與所述訪問時間最接近的網頁。

6.  一種網頁修復方法,其特征在于,所述方法包括:
接收終端發送的網頁;
對所述網頁進行安全過濾;以及
將過濾后的網頁發送至所述終端;
其中,所述網頁為快照服務器基于終端的快照請求信息查找到的匹配的網頁,所述快照請求信息由所述終端響應于確定當前訪問的網頁為失效網頁而發送。

7.  根據權利要求6所述的方法,其特征在于,所述快照請求信息至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間。

8.  根據權利要求6或7所述的方法,其特征在于,所述對所述網頁進行安全過濾,包括:
基于預先訓練的模型計算所述網頁的安全值;
判斷所述安全值是否超過預設安全閾值;以及
如果未超過,則基于關鍵詞庫、關鍵圖片庫、關鍵視頻庫和關鍵鏈接庫對所述網頁進行過濾。

9.  一種終端,其特征在于,所述終端包括:
第一發送單元,用于在當前訪問的網頁為失效網頁時,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁;
接收單元,用于接收所述快照服務器反饋的匹配的網頁;
第二發送單元,用于向智能服務器發送所述匹配的網頁,以供所述智能服務器對所述匹配的網頁進行安全過濾;
檢測單元,用于檢測從所述智能服務器接收的過濾后的網頁內容中是否包含有效信息;以及
處理單元,用于響應于從所述智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。

10.  根據權利要求9所述的終端,其特征在于,所述快照請求信息至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間。

11.  根據權利要求9或10所述的終端,其特征在于,還包括:
修復單元,用于響應于用戶修復網頁的操作,對網頁進行修復。

12.  一種服務器,其特征在于,所述服務器包括:
接收單元,用于接收終端發送的快照請求信息;
查找單元,用于基于所述快照請求信息查找匹配的網頁;以及
發送單元,用于將查詢結果發送至終端,以供終端將所述匹配的網頁發送至具有過濾功能的服務器進行安全過濾。

13.  根據權利要求12所述的服務器,其特征在于,所述快照請求信息至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間;
所述查找單元用于按如下方式查找匹配的網頁:
在已存儲的網頁中查詢與所述當前訪問的網頁的URL相同且保存時間與所述訪問時間最接近的網頁。

14.  一種服務器,其特征在于,所述服務器包括:
接收單元,用于接收終端發送的網頁;
過濾單元,用于對所述網頁進行安全過濾;以及
發送單元,用于將過濾后的網頁發送至所述終端;
其中,所述網頁為基于終端的快照請求信息查找到的匹配的網頁,所述快照請求信息由所述終端響應于確定當前訪問的網頁為失效網頁而發送。

15.  根據權利要求14所述的服務器,其特征在于,所述快照請求信息至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間。

16.  根據權利要求14或15所述的服務器,其特征在于,所述過濾單元用于按如下方式對所述網頁進行安全過濾:
基于預先訓練的模型計算所述網頁的安全值;
判斷所述安全值是否超過預設安全閾值;以及
如果未超過,則基于關鍵詞庫對所述網頁進行過濾。

17.  一種網頁修復系統,其特征在于,所述系統包括如權利要求9-11任一所述的終端、如權利要求12或13所述的服務器以及如權利要求14-16任一所述的服務器。

說明書

說明書網頁修復方法、終端、服務器及系統
技術領域
本申請涉及計算機技術領域,具體涉及終端技術領域,尤其涉及網頁修復方法、終端、服務器及系統。
背景技術
現有技術中,用戶在使用瀏覽器進行瀏覽和搜索過程中,經常出現一些因為網絡負載過大等原因造成的網頁無法顯示的問題,用戶無法獲知網頁的信息;當用戶希望訪問的網頁失效(例如網址發生變化或包含風險內容)時,用戶也無法通過原網址獲取信息。現有的瀏覽器只向用戶返回錯誤代碼,無法提供網頁內容相關的信息,從而影響了用戶通過瀏覽器搜索和瀏覽的效率。
發明內容
鑒于上述現有技術中的缺陷或不足,期望能夠提供一種對無法訪問的網頁進行修復的方法。進一步地,還期望所修復的網頁能夠提供更多的有效信息。為了實現上述一個或多個目的,本申請提供了網頁修復方法、終端、服務器及系統。
一方面,本申請提供了一種網頁修復方法,包括:如果當前訪問的網頁為失效網頁,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁;接收快照服務器反饋的匹配的網頁;向智能服務器發送匹配的網頁,以供智能服務器對所述匹配的網頁進行安全過濾;檢測從智能服務器接收的過濾后的網頁內容中是否包含有效信息;以及如果從智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。
在某些實現方式中,快照請求信息至少包括當前訪問的網頁的統一資源定位符以及訪問時間。
在某些實現方式中,網頁修復方法還包括:響應于用戶修復網頁的操作,對網頁進行修復。
第二方面,本申請提供了一種網頁修復方法,包括:接收終端發送的快照請求信息;基于快照請求查找匹配的網頁;以及將查詢結果發送至終端,以供終端將匹配的網頁發送至智能服務器進行安全過濾。
在某些實現方式中,快照請求信息至少包括當前訪問的網頁的統一資源定位符以及訪問時間。
在某些實現方式中,基于快照請求查找匹配的網頁,包括:在已存儲的網頁中查詢與當前訪問的網頁的URL相同且保存時間與所述訪問時間最接近的網頁。
第三方面,本申請提供了一種網頁修復方法,包括:接收終端發送的網頁;對網頁進行安全過濾;以及將過濾后的網頁發送至終端。其中,網頁為快照服務器基于終端的快照請求信息查找到的匹配的網頁,快照請求信息由終端響應于確定當前訪問的網頁為失效網頁而發送。
在某些實現方式中,快照請求信息至少包括當前訪問的網頁的統一資源定位符以及訪問時間。
在某些實現方式中,對網頁進行安全過濾,包括:基于預先訓練的模型計算網頁的安全值;判斷安全值是否超過預設安全閾值;以及如果未超過,則基于關鍵詞庫對網頁進行過濾。
第四方面,本申請提供了一種終端,包括:第一發送單元,用于在當前訪問的網頁為失效網頁時,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁;接收單元,用于接收快照服務器反饋的匹配的網頁;第二發送單元,用于向智能服務器發送匹配的網頁,以供智能服務器對匹配的網頁進行安全過濾;檢測單元,用于檢測從智能服務器接收的過濾后的網頁內容中是否包含有效信息;以及處理單元,用于響應于從智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。
在某些實現方式中,快照請求信息至少包括當前訪問的網頁的統一資源定位符以及訪問時間。
在某些實現中,終端還包括修復單元,用于響應于用戶修復網頁的操作,對網頁進行修復。
第五方面,本申請提供了一種服務器,包括:接收單元,用于接收終端發送的快照請求信息;查找單元,用于基于快照請求查找匹配的網頁;以及發送單元,用于將查詢結果發送至終端,以供終端將匹配的網頁發送至具有過濾功能的服務器進行安全過濾。
在某些實現方式中,快照請求信息至少包括當前訪問的網頁的統一資源定位符以及訪問時間;查找單元用于按如下方式查找匹配的網頁:在已存儲的網頁中查詢與當前訪問的網頁的URL相同且保存時間與訪問時間最接近的網頁。
第六方面,本申請提供了一種服務器,包括:接收單元,用于接收終端發送的網頁;過濾單元,用于對網頁進行安全過濾;以及發送單元,用于將過濾后的網頁發送至終端。其中,網頁為基于終端的快照請求信息查找到的匹配的網頁,快照請求信息由終端響應于確定當前訪問的網頁為失效網頁而發送。
在某些實現方式中,快照請求信息至少包括當前訪問的網頁的統一資源定位符以及訪問時間。
在某些實現方式中,過濾單元用于按如下方式對網頁進行安全過濾:基于預先訓練的模型計算網頁的安全值;判斷安全值是否超過預設安全閾值;如果未超過,則基于關鍵詞庫對網頁進行過濾。
第七方面,本申請提供了一種網頁修復系統,包括如本申請第四方面所提供的終端、第五方面所提供的服務器以及第六方面所提供的服務器。
本申請提供的網頁修復方法、終端、服務器及系統,通過對失效網頁進行快照查找和安全過濾,獲取失效網頁的信息,提升了瀏覽器獲取信息的能力,并且可以保證所獲取的信息安全有效,進而提升了用戶通過瀏覽器搜索和瀏覽的效率。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例詳細描述,本申 請的其它特征、目的和優點將會變得更明顯:
圖1示出了可以應用本申請實施例的示例性系統架構;
圖2示出了根據本申請一個實施例的網頁修復方法的示例性流程圖;
圖3示出了根據本申請另一個實施例的網頁修復方法的示例性流程圖;
圖4示出了根據本申請再一個實施例的網頁修復方法的示例性流程圖;
圖5示出了在瀏覽器中應用網頁修復方法的效果示意圖;
圖6示出了根據本申請一個實施例的終端的結構示意圖;
圖7示出了根據本申請一個實施例的服務器的結構示意圖;
圖8示出了根據本申請另一個實施例的服務器的結構示意圖;
圖9示出了根據本申請一個實施例的網頁修復系統的結構示意圖;
圖10示出了基于本申請一個實施例的網頁修復系統中的數據交互示意圖。
具體實施方式
下面結合附圖和實施例對本申請作進一步的詳細說明。可以理解的是,此處所描述的具體實施例僅僅用于解釋相關發明,而非對該發明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與有關發明相關的部分。
需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互組合。下面將參考附圖并結合實施例來詳細說明本申請。
圖1示出了可以應用本申請實施例的示例性系統架構100。
如圖1所示,系統架構100可以包括終端設備101、102、網絡103和服務器104、105。網絡103用以在終端設備101、102和服務器104、105之間提供通信鏈路的介質。網絡103可以包括各種連接類型,例如有線、無線通信鏈路或者光纖電纜等等。
用戶110可以使用終端設備101、102通過網絡103與服務器104、105交互,以接收消息或發送指令。終端設備101、102上可以安裝有瀏覽器,用戶通過瀏覽器獲取網絡103所傳送的消息。
終端設備101、102可以是各種電子設備,包括但不限于個人電腦、智能手機、智能手表、平板電腦、個人數字助理等等。
服務器104、105可以對接收到的數據進行存儲、分析等處理,并將處理結果反饋給終端設備。
應該理解,圖1中的終端設備、網絡和服務器的數目僅僅是示意性的。根據實現需要,可以具有任意數目的終端設備、網絡和服務器。
請參考圖2,其示出了根據本申請一個實施例的網頁修復方法的示例性流程圖。本實施例中以該方法應用于瀏覽器中來舉例說明,該瀏覽器可以安裝于具有網絡連接功能的電子設備中,例如可以安裝于智能手機、平板電腦、膝上型便攜計算機和臺式計算機中。
如圖2所示,在步驟201中,如果當前訪問的網頁為失效網頁,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁。
在本實施例中,當用戶發起訪問網頁的請求時,終端可以根據請求中的網址在網頁服務器中查找對應的網頁,并將查找結果呈現給用戶。如果用戶所訪問的網頁為有效的網頁,則終端可以從網頁服務器中查找到對應的網頁內容,將網頁內容提供給用戶。如果用戶當前訪問的網頁為失效網頁,例如用戶當前訪問的網頁的網址發生了變化,或由于網頁存在安全風險,網頁服務器未返回結果,則終端可以向快照服務器發送快照請求信息,請求快照服務器在保存的網頁快照中查詢與當前訪問的失效網頁匹配的網頁。
在一些可選的實現方式中,快照請求信息可以至少包括當前訪問的網頁的統一資源定位符(Uniform Resource Locator,URL)以及訪問時間。則快照服務器可以查找與網頁URL匹配的網頁快照,并從與網頁URL匹配的網頁快照中選取快照保存時間與訪問時間最接近的網頁快照作為匹配的網頁。
可選地,快照請求信息中還可以包括超文本傳輸協議狀態碼(HTTP狀態碼)。HTTP狀態碼是用以表示網頁服務器HTTP響應狀 態的3位數字代碼,可以包括五種狀態:消息、成功、重定向、請求錯誤以及服務器錯誤。其中,重定向、請求錯誤以及服務器錯誤表示無法通過當前的網址訪問網頁。則快照服務器可以進一步根據HTTP狀態碼判斷網頁的失效原因,并根據失效原因進一步查找匹配的網頁。例如當瀏覽器返回的HTTP狀態碼為403,則表示網頁服務器拒絕對訪問網頁的請求進行處理。如果返回的HTTP連接狀態中包含拒絕的原因,快照服務器可以根據網頁服務器拒絕的原因對所查找到的與網頁URL匹配的網頁快照進行篩選,并向終端返回篩選后的結果。
在步驟202中,接收快照服務器反饋的匹配的網頁。
在本實施例中,終端可以通過網絡設備接收由快照服務器查找到的匹配的網頁。具體地,快照服務器可以通過網絡設備向終端發送連續的數據,終端在接收到數據后進行處理,將數據還原為快照服務器所查找到的匹配的網頁。
在一些可選的實現方式中,終端可以對快照服務器返回的數據進行判斷,如果快照服務器返回的數據中包含網頁數據,則可以從中提取網頁數據并還原網頁;如果快照服務器返回的數據中不包含網頁數據,則快照服務器未查找到匹配的網頁,當前訪問的網頁無法修復。
在步驟203中,向智能服務器發送匹配的網頁,以供智能服務器對匹配的網頁進行安全過濾。
在本實施例中,終端可以根據快照服務器的反饋結果,向智能服務器發起過濾請求,以過濾網頁中不合法的內容。
可選地,終端向智能服務器發送的過濾請求中可以包含過濾關鍵字,例如“賭博”、“恐怖主義”等,以便瀏覽器基于過濾關鍵字對網頁內容進行過濾。
智能服務器接收到終端發送的匹配的網頁之后,可以對首先對網頁的內容進行解析。例如可以將網頁中的文字內容、圖片內容和視頻內容分別提取出來。之后,可以基于不同的方法對解析后的網頁內容進行安全過濾。例如,可以基于關鍵字匹配技術查找網頁的文字內容中包含的過濾關鍵字,可選地,還可以采用模糊匹配的方法對文字內容中包含的與關鍵字相近的詞過濾。又例如,可以對圖片內容進行特 征提取和紋理分析,基于預設的非法圖像特征集合對圖片內容進行過濾。具體地,可以將提取出的圖像特征與預設的非法圖像特征集合中的圖像特征進行匹配,然后濾除匹配的圖像紋理或包含該圖像紋理的圖片內容。也可以對網頁中的視頻鏈接是否合法進行判斷,如果視頻鏈接為不合法的鏈接,則可以將該視頻鏈接從網頁中過濾。可選地,過濾的方式可以為刪除或覆蓋。
在一些可選的實現方式中,智能服務器可以采用機器學習的方法對網頁內容進行安全過濾。例如,智能服務器可以基于數據庫中的合法網頁、不合法網頁以及經人工過濾的網頁建立樣本集,分別對合法網頁、不合法網頁和經人工過濾的網頁的內容進行分析,然后基于網頁的內容進行訓練,得出過濾模型。在實際應用時,可以對當前訪問的網頁內容進行分析,將網頁內容輸入該過濾模型進行過濾,得出安全、合法的網頁內容。
在步驟204中,檢測從智能服務器接收的過濾后的網頁內容中是否包含有效信息。
在本實施例中,終端可以從智能服務器接收數據,并檢測接收到的數據中是否包含匹配的網頁的有效信息。具體地,如果步驟202中快照服務器查找到的匹配的網頁在步驟203中被智能服務器全部過濾,即匹配的網頁中的信息被完全屏蔽,則智能服務器可以向終端發送消息,該消息中不包含網頁的有效信息。如果步驟202中快照服務器查找到的匹配的網頁在步驟203中被智能服務器部分過濾,則終端從智能服務器接收的數據中可以包含經過濾的網頁內容,其中包含網頁的有效信息。
終端在接收到智能服務器發送的數據后,可以對數據進行解析,并分析其中是否包含與網頁內容相關的信息,即有效信息。可選地,智能服務器返回的數據中還可以包括狀態信息。狀態信息可以用于指示網頁的過濾結果,例如網頁是否被完全屏蔽。終端還可以根據智能服務器返回的狀態信息判斷過濾后的網頁內容中是否包含有效信息。
在步驟205中,如果從智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。
如果步驟204中終端檢測到從智能服務器接收的過濾后的網頁內容中包含有效信息,則可以確定網頁可修復。這時,終端可以將接收到的網頁內容添加至緩存中,并向用戶提供修復網頁的接口。該接口可以以彈窗形式呈現在終端的瀏覽器中。例如在瀏覽器的邊緣位置配置“修復網頁”的彈出窗口。
在一些實施例中,上述網頁修復方法還可以包括:響應于用戶修復網頁的操作,對網頁進行修復。
用戶可以通過終端所提供的接口獲知當前訪問的失效網頁可以修復。如果用戶希望進一步獲取相關的信息,則可以執行修復網頁的操作。該操作可以通過終端所提供的修復網頁的接口來實現。具體地,當用戶選擇修復網頁(例如點擊“修復網頁”)時,終端可以向用戶展示緩存的網頁內容,從而實現網頁的修復。
本申請上述實施例提供的網頁修復方法,終端可以接收快照服務器查找到的與失效網頁匹配的網頁,并通過智能服務器對匹配的網頁進行安全過濾,可以獲取失效網頁的信息,實現網頁的修復,提升了瀏覽器獲取信息的能力,并且可以保證所獲取的信息安全有效。
進一步參考圖3,其示出了根據本申請另一個實施例的網頁修復方法的示例性流程圖。
如圖3所示,在步驟301中,接收終端發送的快照請求信息。
搜索引擎在收錄網頁時可以將網頁的備份保存在快照服務器中。在本實施例中,當終端檢測到用戶當前訪問的網頁為失效網頁時,可以向快照服務器發送快照請求信息,以獲取當前訪問的網頁的快照。快照服務器可以通過網絡設備從終端接收快照請求信息。該網絡設備可以包括網線、無線路由器、光纖電纜等傳輸數據的設備。
在一些實現中,快照請求信息可以至少包括當前訪問的網頁的URL以及訪問時間。進一步地,快照請求信息還可以包括HTTP狀態碼。在一些實現中,快照請求信息中還可以包括訪問網頁的網絡互聯協議(Internet Protocol,IP)地址。
在步驟302中,基于快照請求信息查找匹配的網頁。
在本實施例中,快照服務器可以根據快照請求在已存儲的網頁快 照中進行查找。當快照請求中包含當前訪問的網頁的URL以及訪問時間時,快照服務器可以在已存儲的網頁中查找與當前訪問的網頁的URL相同的網頁。由于快照服務器可以保存不同時間的網頁備份,即保存同一網頁的多個不同時間的備份,因此快照服務器可以根據失效的網頁的URL查找到多個網頁快照。進一步地,快照服務器可以基于訪問時間從查找到的多個網頁快照中選擇保存時間與訪問時間最接近的網頁最為匹配的網頁。
在一些實現中,快照服務器可以在已存儲的網頁中查找與當前訪問的網頁的URL相似的網頁。網頁URL的相似度計算可以如下進行:提取URL中的站點特征和目錄特征,基于站點特征和目錄特征計算URL間的相似度。這樣,可以得出與當前訪問的網頁URL相似的網頁。之后,快照服務器可以基于網頁內容的特征對相似的網頁進行篩選,例如可以基于網頁的標題、關鍵詞等篩選出與當前訪問的網頁最匹配的網頁。
在步驟303中,將查詢結果發送至終端,以供終端將匹配的網頁發送至智能服務器進行安全過濾。
在本實施例中,快照服務器可以將查詢的結果通過網絡發送至終端。如果步驟302中快照服務器未查找到匹配的網頁,則可以向終端發送消息,該消息可以指示快照服務器的查詢結果為無匹配的網頁。終端可以根據接收到的消息確定網頁無法修復。
如果步驟302中快照服務器查找到一個或多個匹配的網頁,則可以將查找到的網頁作為查詢結果發送給終端。終端在接收到查詢結果之后,可以將一個或多個匹配的網頁發送至智能服務器進行安全過濾。可選地,快照服務器還可以向終端發送消息,告知終端查找到匹配的網頁。則終端可以根據該消息向智能服務器發起網頁過濾請求。
智能服務器可以根據過濾關鍵詞等預設的過濾規則對終端發送的網頁進行過濾。具體地,可以首先對網頁內容進行分析處理,例如分詞處理,然后基于過濾關鍵詞庫進行匹配,將匹配的關鍵詞從網頁中濾除。過濾的方式可以為覆蓋或刪除。也可以提取網頁中的圖片和視頻,基于預設的圖片庫和視頻庫對圖片和視頻進行過濾。在一些實現 中,網頁中可能包含不合法的鏈接,智能服務器可以提取網頁中的鏈接,檢測鏈接是否與不合法鏈接庫中的鏈接匹配,如果匹配,則將鏈接從網頁中濾除。
進一步地,智能服務器可以采用合法的網頁內容替換不合法的網頁內容。例如可以選取與網頁內容相關的合法的詞語、圖片、視頻和鏈接替換不合法的詞語、圖片、視頻和鏈接。從而盡可能地恢復網頁原來的信息,并保證信息的合法性和安全性。
本申請的上述實施例中,在用戶當前訪問的網頁失效時,快照服務器可以基于終端發送的快照請求查找到失效的網頁匹配的網頁快照,并進一步將查找到的網頁快照返回終端,以供終端將網頁快照發送至智能服務器進行過濾,實現對失效的網頁的修復,從而使用戶通過快照服務器的查詢結果獲取更多的信息。
進一步參考圖4,其示出了根據本申請再一個實施例的網頁修復方法的示例性流程圖。
如圖4所示,在步驟401中,接收終端發送的網頁。
終端發送的網頁可以為快照服務器基于終端的快照請求信息查找到的匹配的網頁。快照請求信息可以由所述終端響應于確定當前訪問的網頁為失效網頁而發送。
在本實施例中,如果用戶當前訪問的網頁為失效網頁,則終端可以向快照服務器發出快照請求信息。快照請求信息可以包括失效網頁的相關信息以及訪問的相關信息,例如失效網頁的HTTP狀態碼、用戶IP地址等。在一些實現中,快照請求信息至少可以包括當前訪問的網頁的統一資源定位符以及訪問時間快照服務器可以基于快照請求信息中的URL、時間以及IP地址查找與失效網頁匹配的網頁。查找到之后,快照服務器可以向終端發送匹配的網頁。終端可以將匹配的網頁發送給智能服務器。智能服務器可以通過網絡接收終端發送的匹配的網頁。
在步驟402中,對網頁進行安全過濾。
在本實施例中,智能服務器可以基于過濾關鍵詞等預設的過濾規則對終端發送的網頁進行過濾。具體地,可以首先對網頁內容進行分 析處理,例如分詞處理,然后基于過濾關鍵詞庫進行匹配,將匹配的關鍵詞從網頁中濾除。對網頁的分析處理也可以為提取網頁中的圖片和視頻。然后可以基于預設的圖片庫和視頻庫對圖片和視頻進行過濾。在一些實現中,智能服務器可以提取網頁中的鏈接,檢測鏈接是否與不合法鏈接庫中的鏈接匹配,如果匹配,則可以將鏈接從網頁中濾除。
在一些可選的實現方式中,對網頁進行安全過濾可以通過如下方式進行:首先基于預先訓練的模型計算所述網頁的安全值,然后判斷安全值是否超過預設安全閾值,如果未超過,則基于關鍵詞庫對網頁進行過濾;如果超過,則可以將網頁發送至過濾服務器,以進行人工分析。可以利用大量未經過濾的網頁和經過人工過濾的網頁作為訓練樣本進行訓練。其中,人工過濾的網頁可以被劃分為低安全等級、中安全等級和高安全等級。低安全等級的網頁可以為風險較高的網頁,需要深度分析和人工分析。中安全等級的網頁可以為可基于關鍵詞庫、關鍵圖片庫、關鍵視頻庫以及關鍵鏈接庫過濾的網頁,高安全等級的網頁可以為無需過濾的網頁。每個安全等級對應不同的安全值區間。在應用時,可以首先基于訓練好的安全值計算模型計算待過濾的網頁的安全值,然后根據安全值所屬的區間確定待過濾網頁的安全等級。可選地,當待過濾網頁的安全值未超過預設安全閾值時,可以認為待過濾的網頁為中安全等級的網頁。該預設安全閾值可以基于大數據量的樣本訓練得出。可以基于關鍵詞庫、關鍵圖片庫、關鍵視頻庫和關鍵鏈接庫對網頁中的關鍵詞、關鍵圖片、關鍵視頻和關鍵鏈接進行過濾,刪除或覆蓋網頁中的關鍵詞、關鍵圖片、關鍵視頻以及關鍵鏈接。
當待過濾網頁的安全值超過預設安全閾值時,可以認為待過濾的網頁為低安全等級的網頁,這時可以將網頁發送至后臺的過濾服務器,以對網頁進行人工分析。
進一步地,智能服務器可以選取與網頁內容相關的其他詞語,圖片、視頻和鏈接替換網頁中的關鍵詞、關鍵圖片、關鍵視頻和關鍵鏈接。從而盡可能地恢復網頁原來的信息,并保證信息的合法性和安全性。
在步驟403中,將過濾后的網頁發送至終端。
在本實施例中,智能服務器在對網頁進行安全過濾之后,可以通過網絡將過濾后的網頁發送至終端。過濾后的網頁可以包含用戶感興趣的有效信息,且安全性高。終端在接收到智能服務器反饋的網頁之后,可以向用戶提供修復網頁的接口。當用戶通過接口發出修復網頁的指令時,終端可以將從智能服務器接收到的過濾后的網頁顯示在瀏覽器界面中,從而為用戶提供與失效網頁內容相關的信息。
上述結合圖4描述實施例中,智能服務器對終端從快照服務器獲取的失效網頁的網頁快照進行安全過濾,可以實現對失效網頁的修復,同時保證修復的網頁信息的安全性和合法性。
需要說明的是,上述結合圖2、圖3、圖4所描述的實施例中,快照服務器和智能服務器可以為同一服務器。這個服務器可以集成快照查找功能和安全過濾功能。這時,服務器在基于快照請求查找出的匹配的網頁之后,可以向終端發送匹配的網頁,之后由終端對網頁的內容是否有效進行檢測之后反饋給服務器。在一些實現中,服務器也可以直接對查找出的匹配的網頁進行安全過濾,并將過濾后的網頁發送給終端,無需將查找結果反饋給終端。
進一步參考圖5,其示出了在瀏覽器中應用網頁修復方法的效果示意圖。如圖5所示,瀏覽器510在打開網頁時,網頁服務器向瀏覽器510返回連接狀態511。連接狀態511中,當前訪問的網頁的HTTP狀態碼為“404 Not Found”,即瀏覽器510未從網頁服務器獲取所請求的網頁信息。這時,可以認為用戶所請求的網頁為失效網頁。瀏覽器510可以向快照服務器發起請求,快照服務器可以基于請求查找與用戶請求的網頁最相似的網頁并將查找結果反饋給瀏覽器510。之后瀏覽器可以將快照服務器返回的網頁發送至智能服務器進行過濾,并接收由智能服務器過濾后的網頁。這時,瀏覽器510可以在網頁中生成彈出窗口512,提示用戶該網頁可以修復,并詢問是否查看修復的網頁。當用戶選擇“是”時,瀏覽器510可以在當前的頁面中顯示從智能服務器接收的網頁。
進一步參考圖6,其示出了根據本申請一個實施例的終端的結構示意圖。如圖6所示,終端可以包括第一發送單元601、接收單元602、 第二發送單元603、檢測單元604以及處理單元605。其中,第一發送單元601可以用于在當前訪問的網頁為失效網頁時,向快照服務器發送快照請求信息,以供快照服務器查找匹配的網頁。接收單元602可以用于接收快照服務器反饋的匹配的網頁。第二發送單元603可以用于向智能服務器發送匹配的網頁,以供智能服務器對匹配的網頁進行安全過濾。檢測單元604可以用于檢測從智能服務器接收的過濾后的網頁內容中是否包含有效信息。處理單元605可以用于響應于從智能服務器接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。可選地,智能服務器和快照服務器可以為同一服務器。該服務器可以具有快照查找功能和安全過濾功能。
第一發送單元601發送的快照請求信息可以包括用戶當前訪問的網頁的相關信息,例如HTTP狀態碼、IP地址等。在一些實現中,快照請求信息可以至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間。
在一些實現中,接收單元602還可以通過網絡接快照服務器返回的消息,并根據接收到的消息判斷快照服務器是否查詢到匹配的網頁。在確定快照服務器查詢到匹配的網頁時通過網絡接收快照服務器發送的網頁數據。處理單元605可以在瀏覽器中配置接口。用戶可以通過處理單元605配置的接口選擇修復網頁。
在一些實施例中,終端600還可以包括修復單元606(未示出)。修復單元606可以用于響應于用戶修復網頁的操作,對網頁進行修復。
上述實施例提供的終端,通過向快照服務器發起快照請求,接收快照服務器返回的匹配的網頁,之后將匹配的網頁發送至智能服務器進行安全過濾,最后從智能服務器接收過濾后的網頁,能夠實現對由于網頁過期、網頁服務器負載過大等原因而無法訪問的網頁的修復,獲取失效網頁的信息,提升了瀏覽器獲取信息的能力,并且可以保證所獲取的信息安全有效。
進一步參考圖7,其示出了根據本申請一個實施例的服務器的結構示意圖。如圖7所示,服務器700可以包括接收單元701、查找單元702以及發送單元703。其中接收單元701可以用于接收終端發送 的快照請求信息。查找單元702可以用于基于接收單元701接收到的快照請求信息查找匹配的網頁。發送單元703可以用于將查詢結果發送至終端,以供終端將匹配的網頁發送至具有過濾功能的服務器進行安全過濾。
在一些可選的實現方式中,快照請求信息可以至少包括當前訪問的網頁的統一資源定位符以及訪問時間。查找單元702可以用于按如下方式查找匹配的網頁:在已存儲的網頁中查詢與當前訪問的網頁的URL相同且保存時間與訪問時間最接近的網頁,將查找到的網頁作為匹配的網頁。
上述結合圖7描述的實施例所提供的服務器,可以對終端發送的快照請求進行處理,查找與用戶訪問的失效網頁相匹配的網頁,并將相匹配的網頁發送給終端。可以獲取與失效網頁相關的信息,提升了瀏覽器獲取信息的能力。
進一步參考圖8,其示出了根據本申請另一個實施例的服務器的結構示意圖。如圖8所示,服務器800可以包括接收單元801、過濾單元802以及發送單元803。接收單元801可以用于接收終端發送的網頁。過濾單元802可以用于對網頁進行安全過濾。發送單元803可以用于將過濾后的網頁發送至終端。其中接收單元801所接收的網頁可以為基于終端的快照請求信息查找到的匹配的網頁。快照請求信息可以由終端響應于確定當前訪問的網頁為失效網頁而發送。在一些實現中,快照請求信息可以至少包括所述當前訪問的網頁的統一資源定位符以及訪問時間。
在一些實現中,過濾單元802可以用于按如下方式對網頁進行安全過濾:基于預先訓練的模型計算網頁的安全值;判斷安全值是否超過預設安全閾值;如果未超過,則可以基于關鍵詞庫對網頁進行過濾;如果超過,則可以將網頁發送至指定的服務器,以進行人工分析。這樣,可以保證過濾后的網頁中包含有效、安全、可靠的內容。
上述結合圖8描述的實施例所提供的服務器,可以通過對終端發送的與失效網頁相匹配的網頁進行安全過濾,能夠修復失效網頁。使得用戶在網頁失效時也能夠獲取有效的網頁信息。
應當理解,終端600、服務器700和服務器800中記載的諸單元分別與參考圖2、3、4描述的方法中的各個步驟相對應。由此,上文針對方法描述的操作和特征同樣適用于終端600、服務器700和服務器800及其中包含的單元,在此不再贅述。
在一些實現中,服務器700和服務器800的各單元可以集成在同一個服務器中。即可以由同一個服務器來執行快照查找和安全過濾的操作。該服務器可以包括服務器700和800中的單元。
請參考圖9,其示出了根據本申請一個實施例的網頁修復系統的結構示意圖。如圖9所示,網頁修復系統900可以包括終端600、服務器700以及服務器800。
終端600可以包括第一發送單元、接收單元、第二發送單元、檢測單元以及處理單元。第一發送單元可以用于在當前訪問的網頁為失效網頁時,向服務器700發送快照請求信息,以供服務器700查找匹配的網頁。接收單元可以用于接收服務器700反饋的匹配的網頁。第二發送單元可以用于向服務器800發送匹配的網頁,以供服務器800對匹配的網頁進行安全過濾。檢測單元可以用于檢測從服務器800接收的過濾后的網頁內容中是否包含有效信息。處理單元可以用于響應于從服務器800接收的過濾后的網頁內容中包含有效信息,向用戶提供修復網頁的接口。
服務器700可以包括接收單元、查找單元以及發送單元。其中接收單元可以用于接收終端600發送的快照請求信息。查找單元可以用于基于接收單元接收到的快照請求信息查找匹配的網頁。發送單元可以用于將查詢結果發送至終端600,以供終端600將匹配的網頁發送至服務器800進行安全過濾。
服務器800可以包括接收單元、過濾單元以及發送單元。接收單元可以用于接收終端600發送的網頁。過濾單元可以用于對接收到的網頁進行安全過濾。發送單元可以用于將過濾后的網頁發送至終端600。其中接收單元所接收的網頁可以為服務器700基于終端600的快照請求信息查找到的匹配的網頁。快照請求信息可以由終端600響應于確定當前訪問的網頁為失效網頁而發送。
在一些實現中,服務器700和服務器800中的單元可以集成在同一個服務器中,則網頁修復系統可以包括終端600和集成了服務器700和800中的單元的服務器。
進一步參考圖10,其示出了基于本申請一個實施例的網頁修復系統中的數據交互示意圖。在本實施例中,快照服務器1002可以用于查找網頁快照,智能服務器1003可以用于對快照服務器查找到的網頁進行過濾。
如圖10所示,當用戶通過終端1001訪問某個網址或在搜索引擎中檢索時,終端1001可以對網頁服務器返回的內容進行檢測。當網頁由于網址過期、服務器負載過大、流量控制等因素而無法訪問時,終端1001可以向快照服務器1002發起快照請求1010,快照服務器在接收到快照請求1010之后,可以根據快照請求中的訪問網頁的相關信息(如URL、訪問時間等)進行快照查找,如果查找到匹配的網頁快照,則快照服務器1002可以向終端1001發送反饋匹配的網頁的消息1020。隨后,終端1001可以向智能服務器1003發起過濾請求1030,將匹配的網頁發送給智能服務器1003,智能服務器1003可以基于預設的規則對網頁內容進行過濾,之后向終端1001返回反饋過濾結果的消息1040。如果反饋過濾結果的消息1040中包含網頁的有效信息,則網頁可以被修復。終端1001可以響應于用戶修復網頁的請求,將從反饋過濾結果的消息1040中提取出的網頁內容展示給用戶,實現網頁的修復。
本申請上述實施例提供的網頁修復系統,通過對失效網頁進行快照查找,并對查找到的網頁進行安全過濾,可以在終端上獲取失效網頁的信息,提升了瀏覽器獲取信息的能力,并且可以保證所獲取的信息的安全性和有效性。
作為另一方面,本申請還提供了一種計算機可讀存儲介質,該計算機可讀存儲介質可以是上述實施例中所述裝置中所包含的計算機可讀存儲介質;也可以是單獨存在,未裝配入終端設備中的計算機可讀存儲介質。該計算機可讀存儲介質存儲有一個或者一個以上程序,該程序可以包含用于執行流程圖所示的方法的程序代碼。
附圖中的流程圖和框圖,圖示了按照本發明各種實施例的系統、裝置、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現規定的邏輯功能的可執行指令。也應當注意,在有些作為替換的實現中,方框中所標注的功能也可以以不同于附圖中所標注的順序發生。例如,兩個接連地表示的方框實際上可以基本并行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執行規定的功能或操作的專用的基于硬件的系統來實現,或者可以用專用硬件與計算機指令的組合來實現。
以上描述僅為本申請的較佳實施例以及對所運用技術原理的說明。本領域技術人員應當理解,本申請中所涉及的發明范圍,并不限于上述技術特征的特定組合而成的技術方案,同時也應涵蓋在不脫離所述發明構思的情況下,由上述技術特征或其等同特征進行任意組合而形成的其它技術方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術特征進行互相替換而形成的技術方案。

關于本文
本文標題:網頁修復方法、終端、服務器及系統.pdf
鏈接地址:http://www.wwszu.club/p-6369514.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大 22433941628869021295047238295656461912246755584494522128074038602133335915961673118527773776651947 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();