鬼佬大哥大
  • / 16
  • 下載費用:30 金幣  

一種基于貝葉斯組合的WEB服務QOS預測方法.pdf

摘要
申請專利號:

CN201510305456.3

申請日:

2015.06.05

公開號:

CN105046045A

公開日:

2015.11.11

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 19/00申請日:20150605|||公開
IPC分類號: G06F19/00(2011.01)I 主分類號: G06F19/00
申請人: 河海大學
發明人: 張鵬程; 孫潁桃; 安紀存; 陳潔; 曾金偉; 韓晴
地址: 211100江蘇省南京市江寧區佛城西路8號
優先權:
專利代理機構: 南京蘇高專利商標事務所(普通合伙)32204 代理人: 李玉平
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510305456.3

授權公告號:

||||||

法律狀態公告日:

2018.06.19|||2015.12.09|||2015.11.11

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明公開一種基于貝葉斯組合的Web服務QoS預測方法,提出貝葉斯組合預測模型對服務質量進行預測,該方法首先對時間序列特征進行識別,根據識別結果選取合適的基本預測模型,對已選取的模型進行訓練,然后使用預測-權值調整-預測的循環結構進行預測。在預測的過程中,通過不斷調整基本預測模型權重的方式使得結果逼近預測效果最好的模型,保持相對優良的預測精度。為了驗證預測效果,對響應時間,吞吐量,可靠性等QoS屬性進行預測,并且采用精度分析和有效性評估兩種方式對實驗結果進行比較,實驗表明,不同特征的時間序列樣本下,貝葉斯組合預測模型能保持較高的預測精度,趨近于最優的預測模型,提供較為穩定良好的預測表現。

權利要求書

1.一種基于貝葉斯組合的Web服務QoS預測方法,其特征在于,包括以下步驟:步驟1:識別時間序列特征,采用自相關分析法,時間序列的自相關系數計算公式如下:其中rk表示i期屬性值xi與i+k期屬性值xi+k的相關程度;根據公式判別時間序列是平穩模式、趨勢模式、周期模式還是隨機模式;步驟2:對各個基本模型分別進行訓練建模;步驟3:用訓練好的基本預測模型對時間序列進行預測;步驟4:由貝葉斯組合模型對各個基本模型的預測結果進行組合;采用基于小波分析的ARIMA預測模型(WARIMA)、小波神經網絡預測模型(WNN)以及ARIMAGARCH預測模型3種基本預測模型對QoS進行預測,來驗證貝葉斯組合模型的有效性;針對平穩型、趨勢型、周期型QoS屬性,可以采用某個函數或者方程擬合,即采用RBF神經網絡,多元自回歸模型,K-近鄰模型作為基本預測模型進行貝葉斯組合,來驗證貝葉斯組合模型的有效性;步驟5:預測模型精度評估及有效性評估步驟6:修正組合模型參數;第t+1時刻,組合模型預測的結果為:式中q′t+1為t+1時刻貝葉斯組合模型預測值;為t+1時刻第m個基本預測模型在組合模型中的權值;為t+1時刻第m個基本預測模型預測值;步驟7:判斷模型預測表現是否較好;步驟8:若表現較好,就賦予較高的期望并繼續預測;否則,重復步驟2-6。2.如權利要求1所述的基于貝葉斯組合的Web服務QoS預測方法,其特征在于,利用相對誤差均值、均方根誤差、相對誤差概率分布評估預測模型的精度;引入“二進制”預測評估指標對預測模型進行有效性評估:精度評估:相對誤差均值:其中N為預測時段中預測量的個數,yi表示第i個實際觀測值,y′i為第i個預測值;MSPE反映預測值偏離實際值的程度;均方根誤差:其中N為預測時段中預測量的個數,yi表示第i個實際觀測值,y′i為第i個預測值;RMSE不僅反映相對誤差的大小,還反映預測結果的穩定性;相對誤差概率分布:其中N為預測時段中預測量的個數,為相對誤差小于p值的預測量個數,yi表示第i個實際觀測值,y′i為第i個預測值;中誤差概率分布表示預測結果的可信度;以上誤差值越小,意味著模型預測越準確。

說明書

一種基于貝葉斯組合的Web服務QoS預測方法

技術領域

本發明涉及一種基于貝葉斯組合的Web服務QoS預測方法,使用幾種組合模型對時間序列進行預測,通過模型評估標準對結果進行評估,并及時調整模型權重,以優化測試結果。

背景技術

面向服務系統越來越多地通過互聯網訪問第三方Web服務,質量保證和軟件維護由第三方控制,軟件本身執行和管理也取決于第三方。面向服務系統的執行能力以及服務質量越來越依賴于第三方提供的服務,然而在復雜多變的Internet環境中,這種對于第三方服務的依賴會帶來不確定的問題,使得服務無法滿足QoS(QualityofService,服務質量)需求。因此,需要對服務質量進行預測,通過預測判斷是否可能發生服務失效,提前采取行動消除或減輕對系統質量的負面影響,避免威脅發生。近年來,Web服務QoS預測技術受到越來越多的關注,很多模型被提出并用于運行時QoS的預測,如神經網絡模型、時間序列分析等。

目前針對原子Web服務,主要采用機器學習、數據挖掘的方法來預測QoS值,可以歸納劃分為以下幾類:(1)基于相似度的QoS預測方法。(2)基于神經網絡的QoS預測方法。(3)基于時間序列預測的QoS預測方法。(4)其他QoS預測方法。單一的模型通常會在某一時段有良好的預測精度,但各種預測方法有特殊的信息特征和適用場合,目前還沒有一種算法能在不同狀況下、不同時刻都保持絕對優良的預測性能。Web服務在動態環境下,服務質量具有動態性和易變性,單一模型難以保持較好的預測性能,需要將預測方法組合起來,利用各種預測方法的長處,提高精度并擴大適用范圍。因此提出了貝葉斯組合預測模型,根據QoS屬性時間序列的特征,選取不同的基本預測模型進行組合,預測過程中通過已選取的基本預測模型的預測表現,更新各個基本模型的權重,使得模型預測結果能夠逼近最優模型,從而具有穩定良好的預測精度。

發明內容

發明目的:針對現有技術中存在的問題,本發明提供一種Web服務QoS貝葉斯組合預測的方法,根據QoS歷史數據不同的特征形態組合不同的基本模型進行預測,并給出預測模型評估標準,對響應時間、吞吐量及可靠性進行了預測實驗。以提前發現軟件的異常和一些QoS狀況,為軟件系統的動態自適應調整和演化等活動提供決策依據,從而保證軟件系統的安全可靠運行。

技術方案:一種基于貝葉斯組合的Web服務QoS預測方法,包括以下步驟:

步驟1:識別時間序列特征,采用自相關分析法,時間序列的自相關系數計算公式如下: r k = Σ i = 1 n - k ( x i - x ) ( x i + k - x n ) Σ i = 1 n ( x i - x ) 2 . ]]>其中 x = 1 n Σ i = 1 n x i , ]]>rk表示i期屬性值xi與i+k期屬性值xi+k的相關程度。根據公式判別時間序列是平穩模式、趨勢模式、周期模式還是隨機模式。

步驟2:對各個基本模型分別進行訓練建模。

步驟3:用訓練好的基本預測模型對時間序列進行預測。

步驟4:由貝葉斯組合模型對各個基本模型的預測結果進行組合。擬采用基于小波分析的ARIMA預測模型(WARIMA)、小波神經網絡預測模型(WNN)以及ARIMAGARCH預測模型3種基本預測模型對QoS進行預測,來驗證貝葉斯組合模型的有效性。針對平穩型、趨勢型、周期型QoS屬性,可以采用某個函數或者方程擬合,即采用RBF神經網絡,多元自回歸模型,K-近鄰模型作為基本預測模型進行貝葉斯組合,通過實驗及結果分析來驗證貝葉斯組合模型的有效性。

步驟5:預測模型精度評估及有效性評估

精度評估:

1、相對誤差均值:其中N為預測時段中預測量的個數,yi表示第i個實際觀測值,y′i為第i個預測值。MSPE反映預測值偏離實際值的程度。

2、均方根誤差:其中N為預測時段中預測量的個數,yi表示第i個實際觀測值,y′i為第i個預測值。RMSE不僅反映相對誤差的大小,還反映預測結果的穩定性。

3、相對誤差概率分布:其中N為預測時段中預測量的個數,為相對誤差小于p值的預測量個數,yi表示第i個實際觀測值,y′i為第i個預測值。其中誤差概率分布表示預測結果的可信度。以上誤差值越小,意味著模型預測越準確。

有效性評估:

引入“二進制”預測評估指標,QoS屬性是否違反約束,服務是否發生失效,這個問題本身要么為肯定,要么為否定,實例要么屬于肯定類,要么屬于否定類,因而QoS失效預測屬于二分問題。二分問題會出現四種情況,如果一個實例是肯定類且被預測為肯定類,則稱為真肯定(Truepositive,TP),如果實例是肯定類被預測為否定類,則稱為假否定(Falsepositive,FP),如果實例是否定類被預測為否定類,則稱為真否定(Truenegative,TN),如果實例是否定類被預測為肯定類,則稱為假肯定(Falsenegative,FN)。列聯表表示為:

根據聯表,引入尺度評價:

真肯定率(r)描述實際失效的樣本被預測為真肯定的概率:精度(p)描述預測真肯定占肯定的比率:假肯定率(fpr)描述被預測為假肯定的實例占所有否定類的比例:正確率(a)描述正確預測的概率:F值(Fβ)描述p和r的調和均值:對于失效預測來說,p值用來評估正確自適應行為在所有自適應中的比率,p值越大,誤報的可能性越低。r值用來評估正確預報失效的的概率,r值越大,漏報概率越低。p和r都要高,才能取得較高的F值。因此F值越高,預測越準確。

步驟6:修正組合模型參數。第t+1時刻,組合模型預測的結果為:式中q′t+1為t+1時刻貝葉斯組合模型預測值;為t+1時刻第m個基本預測模型在組合模型中的權值;為t+1時刻第m個基本預測模型預測值。

步驟7:根據各個模型與真實值的誤差比較判斷模型預測表現是否較好;

步驟8:若表現較好,就賦予較高的期望并繼續預測。否則,重復步驟2-6。

附圖說明

圖1為ARIMA模型的建模流程圖;

圖2為BP神經網絡的算法流程圖;

圖3為ARIMAGARCH模型預測流程圖;

圖4為RBF神經網絡模型K-均值聚類算法流程圖;

圖5為多元回歸分析模型預測流程圖;

圖6為本發明實施例的整體框架圖;

圖7為各模型及貝葉斯組合模型對響應時間的預測結果;

圖8為各模型及貝葉斯組合模型對可靠性的預測結果;

圖9為各模型及貝葉斯組合模型對吞吐量的預測結果。

圖10為誤差分布箱線圖;

圖11為F值分布箱線圖。

具體實施方式

下面結合具體實施例,進一步闡明本發明,應理解這些實施例僅用于說明本發明而不用于限制本發明的范圍,在閱讀了本發明之后,本領域技術人員對本發明的各種等價形式的修改均落于本申請所附權利要求所限定的范圍。

本實施例提供的Web服務QoS貝葉斯組合預測的方法包含了兩個主要部分:對隨機型QoS屬性,采用神經網絡模型(WNN)、基于小波分析的ARIMA(WARIMA)、ARIMAGARCA進行組合預測、對平穩型、趨勢型、和周期型QoS屬性,采用K-近鄰預測模型、RBF神經網絡模型、多元回歸分析模型進行組合預測。

識別時間序列特征,采用自相關分析法,時間序列的自相關系數計算公式如下: r k = Σ i = 1 n - k ( x i - x ) ( x i + k - x n ) Σ i = 1 n ( x i - x ) 2 . ]]>其中 x = 1 n Σ i = 1 n x i , ]]>rk表示i期屬性值xi與i+k期屬性值xi+k的相關程度。

如圖1所示:ARIMAGARCH模型在已建立ARIMA(p,q)模型的基礎上,對模型殘差方差使用GARCH(r,s)模型建模,ARIMA(p,q)模型與GARCH(r,s)模型分別表示序列的均值和條件方差。基于小波分析的ARIMA模型建模步驟如下:

步驟101:判斷時間序列是否是白噪聲時間序列,即是否是平穩序列。

步驟102:如果是白噪聲序列,就表示序列不存在相關性,則不必要再進行預測。如果是非平穩則需要對數據差分,直到平穩。

步驟103:初步判斷p,q,識別時間序列模型。

步驟104:根據p,q,對小于p,q的模型進行分析,一般以取得AIC值最小的模型作為最優模型。

小波神經網絡以BP神經網絡拓撲結構為基礎,采用小波函數作為激勵函數。BP神經網絡相應的算法如下:

步驟201:初始化。在區間(-1,1)對各層的連接權值以及闕值設置一個非零隨機數,對學習速率,目標誤差ε,最大學習次數M進行初始化。

步驟202:導入N個學習樣本X及其相應的期望輸出Y,對第n個樣本進行歸一化處理。

步驟203:依次對各層實際輸出以及誤差計算:分別將輸入層數據導入隱藏層第一、第二個神經節點內進行計算,再將隱藏層數據導入輸入層神經節點計算。得到最終的輸出值。Hj=∑iwijxi+θj,wij是權重,θj是偏倚,f(x)是激活函數。輸出層節點j的誤差:Errj=Oj(1-Oj)(Tj-Oj),Oj為輸出值,Tj為實際值。

步驟204:如果n<N,轉步驟202執行;如果n=N,轉入步驟205。

步驟205:依次修改各層的權重Δwij=(l)ErrjOi,wij=wij+Δwij,其中l為學習率。

步驟206:根據新的權值重新輸出和誤差計算。

步驟207:判斷誤差是否滿足要求,如果誤差小于目標誤差,或者達到最大學習次數,則訓練結束,否則跳到步驟202執行。

如圖3所示,ARIMA-GARCH模型預測步驟如下:

步驟301:檢驗序列是否平穩。

步驟302:非平穩,進行平穩化處理。

步驟303:平穩,則計算自相關/偏相關函數。

步驟304:進行ARMA模式識別。

步驟305:使用最小二乘法進行模型參數估計。

步驟306:異方差檢驗。將樣本分為兩部分,并分別進行回歸,計算兩個子樣的殘差平方和所構成的比,以此判斷是否存在異方差。

步驟307:若存在異方差,則建立ARMA-GARCH模型

步驟308:進行模型參數估計。

步驟309:若無異方差,則利用BIC準則進行模型評估。

步驟310:若模型評估有效,則接收模型。

步驟311:預測。

K-近鄰預測模型的算法步驟為:

將已知的n個時間序列值,移動時間窗口,形成n-m(0<m<n)個樣本實例時間窗口向后移動一步,形成包含待預測值的向量為{xn-m+1,xn-m+2,…,xn;xn+1},基于這組樣本以及向量預測第n+1個序列值xn+1。

計算與實例的歐幾里德距離,計算公式如下:

dist = ( X n - m + 1 , X i ) = Σ i = 1 m ( x j - x ij ) 2 , ]]>其中x′j是中的第j項,xij是中的第j項。歐式距離被用于評估樣本之間存在的空間距離,距離越遠的樣本差異越大。

對歐幾里德距離進行排序,找出的K個近鄰,記為

依據序列值xi總是與前面m個序列值{xi-m,xi-m+1,...,xi-1}相關,向量中的最后一個分項被認為是與前m項相關的可能值,提取K個近鄰的最后一個分項,得到xn+1的K個最近鄰x1j,x2j,…,xkj,其中j=m+1,然后對這K個數加權平均即可算出,即:

如圖4所示,RBF神經網絡模型K-均值聚類算法具體步驟如下:

步驟401:初始化聚類中心,通常將第一次迭代的基函數中心設置為最初的l個樣本,并設迭代步數n=0;

步驟402:隨機輸入訓練樣本X;

步驟403:尋找訓練樣本Xi離哪個中心最近。

步驟404:調整中心。計算訓練樣本的平均值,即新的聚類中心。

步驟405:判斷是否已經學完所有訓練樣本并且中心的分布不再改變,是則結束自組織學習,否則設n=n+1轉到步驟2。

最后得到的Tk(k=1,2,…,l)即為RBF神經網絡最終的基函數的中心。

如圖5所示,多元回歸分析模型預測過程步驟如下:

步驟501:分析影響因素(如吞吐量、相應時間等),采集與影響因素相關的數據。

步驟502:特征分析,依據采集到的數據,判斷時間序列變化趨勢,選擇對應的自變量及數學模型準備建模。

步驟503:模型建立,根據已選擇的數學模型,采用相應的技術進行參數估計。通常使用最小二乘法估計法估計參數。

步驟504:步驟模型顯著性檢驗,對預測模型的相關系數,方差進行顯著性檢驗。

步驟505:根據已經建立的模型進行預測。

預測結果與測試樣本進行比較分析,修正組合模型參數。在前一個時段預測表現較好的模型(與真實值最為接近),在下一個時段賦予較高的期望,然后再繼續用已經訓練好的基本模型進行下一步預測,如果組合模型預測結果與實際結果持續產生較大的誤差,則需要重復以上步驟。

從圖7可以看出,組合模型在開始的幾次預測中,由于基本模型初始權重與實際權重存在偏差,盡管基于小波分析的ARIMA模型預測準確,但組合模型預測值稍有偏差,隨著預測的進行,基本模型權重被修改,預測準確的模型占優,即基于小波分析的ARIMA模型權重占優,組合模型預測值逼近對當前樣本序列預測最優的基于小波分析的ARIMA模型。

從圖8可以看出,在可靠性的預測中,可靠性樣本變化較小,多數樣本表現出線性規律,MR預測模型預測較K近鄰模型和RBF模型更為準確,隨著預測的進行,MR模型權重占優,貝葉斯組合模型的預測結果與其基本重合。

從圖9可以看出,在對吞吐量的預測中,與響應時間樣本相似,基于小波分析的ARIMA模型預測準確,優于其他兩種模型,組合模型預測值逼近對當前樣本序列預測最優的基于小波分析的ARIMA模型預測值。

圖10中,縱坐標表示相對誤差絕對值,(a)描述各個模型對響應時間序列預測的誤差分布,(b)描述對吞吐量樣本1預測的誤差分布,(c)描述對吞吐量樣本2預測的誤差分布,(d)描述對可靠性預測的誤差分布。從圖可以看出,貝葉斯組合模型誤差分布接近基本模型中最優模型的誤差分布。

如圖11(a)所示,ARIMAGARCH的F值分布最廣,闕值的變動對該模型影響最大,預測效果最差。WARIMA預測結果F值分布更廣,但相對集中。如圖4-11(b)所示,所有模型上邊緣與下邊緣距離不超過0.2,上四分位數與下四分位數距離不超過0.1,闕值變動對模型影響小。MR與BC的箱線集中,F值均值高,模型預測效果好。BC箱線圖與預測表現最好的MR模型接近,再次印證貝葉斯組合模型可以挑選最優的預測模型,使得預測更為穩定準確。

因此,隨著預測不斷進行,根據基本模型的預測表現改變基本模型在組合模型中的權重,使得組合模型接近甚至提升基本預測模型的預測表現,在預測過程中保持相對優良的預測精度。

關 鍵 詞:
一種 基于 貝葉斯 組合 WEB 服務 QOS 預測 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于貝葉斯組合的WEB服務QOS預測方法.pdf
鏈接地址:http://www.wwszu.club/p-6401674.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大