鬼佬大哥大
  • / 13
  • 下載費用:30 金幣  

基于模糊曲線分析的時間差高斯過程回歸軟測量建模方法.pdf

摘要
申請專利號:

CN201510541727.5

申請日:

2015.08.28

公開號:

CN105205224A

公開日:

2015.12.30

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/50申請日:20150828|||公開
IPC分類號: G06F17/50 主分類號: G06F17/50
申請人: 江南大學
發明人: 熊偉麗; 李妍君; 薛明晨
地址: 214122 江蘇省無錫市濱湖區蠡湖大道1800號
優先權:
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510541727.5

授權公告號:

||||||

法律狀態公告日:

2018.10.30|||2016.01.27|||2015.12.30

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明公開了一種基于模糊曲線分析的時間差高斯過程回歸軟測量建模方法,適合應用于具有時滯特性的化工過程。本方法能夠從過程歷史數據庫中提取穩定的時滯信息,引入與主導變量序列更加相關的建模數據。首先,基于模糊曲線分析(FCA)的方法直觀判斷輸入序列對于主導序列的重要性,估計過程時滯參數,用離線條件的時滯參數集對建模數據重構;對于新輸入數據,基于一定時刻之前的歷史變量值,采用時間差-高斯過程回歸(TDGPR)模型對當前時刻主導變量值在線預測,該方法不存在模型更新的問題,可以很好地追蹤輸入輸出漂移。本發明方法相比于穩態建模方法能夠對關鍵變量進行更精準的預測,從而提高產品質量,降低生產成本。

權利要求書

權利要求書
1.  基于模糊曲線分析的時間差高斯過程回歸軟測量建模方法,其特征在于,該方法步驟為:
步驟1:收集過程的輸入輸出變量數據組成歷史訓練數據庫,獲取N組樣本{X(t),y(t)},t=1,2,…,N,對數據進行預處理,根據過程機理及經驗來確定各輔助變量中存在的最大的時滯參數Tmax;
步驟2:對于每個原變量xi,i∈{1,2,…,m},分別擴展為含時滯的輸入變量集{xi(t-λ),λ=0,1,…,Tmax}。擴展方式為:

步驟3:根據模糊曲線分析(FCA)方法確定含時滯輸入變量集中每一個變量的重要性程度,確定最優的時滯變量xi(t-di),確定過程為:
輸入變量集{xi,i=1,2,…,m}及輸出變量y,對于輸入變量xi,t時刻采集的樣本值記作xi(t),對于(xi(t),y(t)),輸入變量xi的模糊隸屬度函數定義為:
Φit(xi)=exp[-(xi(t)-xib)2]---(2)]]>
對于每一個xi,{Φit,y(t)}提供了一條模糊規則,描述為{ifxiisΦit(xi),thenyisy(t)},Φit為變量xi關于第t個數據點的輸入變量模糊隸屬度函數,式(2)選取的是高斯模糊隸屬度函數,b取變量xi值域范圍的20%;故N個訓練樣本對應每個變量都有N條模糊規則,在模糊隸屬度函數中,每個點對應的{xi(t),y(t)}處,有Φit=1;
對于時延過程,通過引入時滯信息,原變量xi變為Tmax+1維,可表示為xi(t-λ),λ=0,1,…,Tmax,λ為引入的變量時延值;通過式(3)對擴展后的每個新變量質心去模糊化,可得到第i個變量時延值為λ條件下的模糊曲線Ci,λ;如式(4)所示,di為使模糊曲線Ci,λ覆蓋范圍最大的λ,Ci,λ(λ)max和Ci,λ(λ)min為模糊曲線上點值域的最大值和最小值;
Ci,λ(λ)=Σt=1NΦit[xi(t-λ)]·y(t)Σt=1NΦit[xi(t-λ)]---(3)]]>
di=argmaxλ[Ci,λ(λ)max-Ci,λ(λ)min]---(4)]]>
若得到的Ci,λ(λ)范圍越接近y的范圍,那么輸入變量xi(t-λ)的重要程度越高,對Ci,λ(λ)覆蓋范圍進行排序,可以得到各自的重要性,由此得到最優時滯變量xi(t-di);
步驟4:利用上一步分析得到的xi(t-di)構成時滯輸入集Xd(t)=[x1(t-d1),x2(t-d2),…,xm(t-dm)]T,重 建的軟測量訓練樣本集為{Xd(t),y(t)},如果有新的輸入樣本X(t+1)到來,則基于歷史數據庫用同樣參數進行重組,并轉到步驟5,否則,等待新數據到來;
步驟5:對重組訓練集、重組的新數據進行j次時間差分處理(j的大小可根據過程的主導變量獲得周期和性質確定),差分方式為:
ΔXd,j(t)=Xd(t)-Xd(t-j)(5)
Δyj(t)=y(t)-y(t-j)
然后建立差分輸入輸出樣本之間的高斯過程模型,高斯過程回歸算法為:
給定訓練樣本集X∈Rm×N和y∈RN,m為輸入變量維數,N為樣本數目,輸入和輸出之間的關系滿足:
y=f(x)+ε(6)
其中f是未知的函數形式,ε是均值為0,方差為的高斯噪聲;對于一個新輸入樣本,相應的概率預測輸出也滿足高斯分布,聯合高斯分布為
fgp|X,y,x*~N*(fgp‾,cov(fgp))]]>
s.t.fgp‾=k(x*,X)[K(X,X)+σn2In]-1y---(7)]]>
cov(fgp)=k(x*,x*)-k(X,x*)T[K(X,X)+σn2In]-1·k(X,x*)]]>
K(X,X)為訓練樣本間的n維協方差方陣,k(x*,X)是測試樣本與訓練樣本的協方差向量,k(x*,x*)為測試樣本的自協方差值,GPR可以選擇不同的協方差函數描述樣本分布特征,本文選擇高斯協方差函數:
k(xp,xq)=vexp[-12Σd=1mπd(xpd-xqd)2]---(8)]]>
高斯過程的超參數一般最簡單的方法就是通過極大似然估計得到:
L(Θgp)=-12yT[K(X,X)+σn2I]-1y-12logdet[K(X,X)+σn2I]-n2log2π---(9)]]>
首先將參數Θgp設置為一個合理范圍內的隨機值,然后用共軛梯度法得到優化的參數,獲得最優參數后,對于測試樣本x*,可以用式(7)來估計GPR模型的輸出值;
步驟6:當t+1時刻的新輸入數據到來時,且樣本經過時滯信息重組后,采用TDGPR方法基于yj(t+1-j)得到的預測值yj,pred(t+1)計算方式為:
ΔXd,j(t+1)=Xd(t+1)-Xd(t+1-j)
Δyj,pred(t+1)=fGPR(ΔXd,j(t+1))(10)
yj,pred(t+1)=yj(t+1-j)+Δyj,pred(t+1)
yj,pred(t+1)為本發明方法的預測值。

2.  根據權利要求1所述的基于模糊曲線分析的時間差高斯過程回歸的軟測量建模方法,其特征在于:以一種直觀有效的方式,同時在計算復雜低的情況下,該方法可以從過程歷史數據庫中提取變量的時滯信息用于軟測量建模數據重構,校正了輸入輸出間實際的因果對應關系,同時將在線軟測量模型更新的可能性最小化,不存在更新模型的問題,采用GPR對輸入輸出數據的漂移進行追蹤,能夠很好地提取過程時滯信息,相對于傳統的不考慮時滯的在線模型,能夠得到更加精確的預測結果。

說明書

說明書基于模糊曲線分析的時間差高斯過程回歸軟測量建模方法
技術領域
本發明涉及基于模糊曲線分析的時間差高斯過程回歸(FCA-TDGPR)的軟測量建模方法,屬于復雜工業過程建模和軟測量領域。
背景技術
在實際工業生產過程控制中,需要對一些關鍵變量進行嚴格的把關,以滿足一系列質量控制要求,在現有的技術條件以及經濟代價等問題的制約下直接獲取關鍵變量十分困難。因此,軟測量技術應運而生.它通過構造過程易測變量與難測變量之間的數學關系來推斷和估計待測主導變量,用軟件的方式進行“測量”。
傳統的軟測量建模方法大多考慮零時延特性,即考慮輸入輸出具有同樣的采樣間隔,且在數據庫中按時刻一一對應。然而,通過各個傳感器采集的輸入數據以及通過實驗室分析或者在線儀表獲得的輸出數據間往往存在著顯著的時間滯后,如果繼續采用穩態情況下的建模方法,建立的模型已經不能完全解釋過程的特性,不符合實際過程的因果關系。為了確保軟測量模型能夠在較長時間內實現關鍵變量的精確預測,有必要采取措施引入過程的時滯動態信息。
本質上來說,現有的時滯估計方法大多數都在尋找與主導變量最密切相關的輔助變量用于建模,當投入實際應用中時,需要在算法復雜度與算法精度上取得折衷。針對過程時滯信息的估計問題,目前已有的方法包括互信息(MutualInformation,MI)方法、相關系數的方法等。本發明采用模糊曲線分析(FuzzyCurveAnalysis,FCA)的方法將變量時滯信息引入到軟測量模型中,這種方法的特點是計算復雜度較低同時易于理解,能夠直觀有效地確定輸入變量的重要性程度。
為了對過程動態實時有效地進行跟蹤和控制,軟測量模型性能可以通過周期性地重建來維護,主要方法包括滑動窗(MovingWindow,MW)方法、迭代方法和實時學習(Just-in-timeLearning,JITL)方法,但是這些方法往往需要頻繁地對所建模型進行更新,而時間差(TimeDifference,TD)模型不但能夠處理隨時間推移造成的模型性能下降,能取得更新模型版的追蹤過程動態的效果,而且能夠使得重建模型的可能性最小化。
近年來,基于數據驅動的軟測量建模方法得到了越來越多的關注。一些常用的軟方法如偏最小二乘(partialleastsquares,PLS)、主成分分析(principalcomponentanalysis,PCA)等能夠很好地處理輸入變量和輸出變量之間的線性關系,人工神經網絡(artificialneuralnetworks,ANN)、支持向量機(supportvectormachine,SVM)、最小二乘支持向量機(leastsupportvectorsquaressupportvectormachine,LS-SVM)能夠有效地處理過程的非線性關系。近年來,高斯過程回歸(Gaussianprocessregression,GPR)作為一種非參數概率模型,不僅可以給出預測值,還可以得到預測值的不確定程度。故本發明選擇GPR模型作為基本的軟測量建模模型,結合TD思想來有效地處理過程輸入輸出的漂移。
綜上所述,建立一種考慮時滯問題的在線軟測量模型,對于過程關鍵變量的嚴格控制有著重要的意義。
發明內容
對于時延過程,不考慮時滯的軟測量模型不能夠選取與主導變量序列最相關的輔助變量序列進行建模,采用這樣的模型進行估計時,對主導變量的估計精度造成了很大影響。為了有效地提取出過程時滯信息,同時在不頻繁更新模型的情況下建立在線的軟測量模型,對關鍵變量的預測提供一種更為有效的在線策略。本發明提供一種基于FCA-TDGPR的軟測量建模方法。
本發明是通過以下技術方案實現的:
基于FCA-TDGPR的軟測量建模方法,所述方法包括以下過程:針對時延過程,首先,對于離線采集的輔助變量和主導變量歷史時刻值,搜集足夠多的樣本數據,組成歷史數據庫。
在離線階段通過FCA方法確定過程各輔助變量相對于主導變量序列的時間滯后參數,用于軟測量建模數據重構;
然后,對于新的輸入數據,基于一定時刻之前采集的歷史變量值,采用時間差-高斯過程回歸(TDGPR)模型對當前時刻主導變量值進行在線預測,從而實現對于關鍵變量的實時估計和控制,得到更加精確的結果,從而提高產量,降低生產成本。
附圖說明
圖1為基于FCA-TDGPR的在線軟測量方法建模流程圖;
圖2為脫丁烷塔過程示意圖;
圖3為TDGPR建模思路示意圖;
圖4為原變量與最優時滯變量的模糊曲線分布圖;
圖5為不同j值情況下的丁烷濃度預測結果散點圖。
具體實施方式
下面結合圖1所示的建模流程圖,對本發明做進一步詳述:
以實際化工過程為例,脫丁烷塔過程是石油煉制生產過程中脫硫和石腦油分離裝置的重要組成部分,需要控制的主導變量之一為塔底的丁烷(C4)濃度,過程示意圖如圖2所示。由于丁烷濃度值不能直接檢測得到,分析與獲得存在滯后問題,同時不同輔助變量有著不同程度的滯后。實驗數據來源于實際工業過程,該數據包含樣本2394組,共有7個輔助變量,如圖2中標注所示:x1為塔頂溫度;x2為塔頂壓力;x3為塔頂回流量;x4為塔頂產品流出量;x5為第6層塔板溫度;x6為塔底溫度1;x7為塔底溫度2,1個主導變量是塔底丁烷濃度,將塔底丁烷濃度作為過程關鍵變量進行預測。
步驟1:收集歷史輸入輸出數據組成包含N組連續樣本的訓練數據庫,假設其按時刻表示為{X(t),y(t)},t=1,2,…,N,對數據進行預處理,將2個塔底溫度變量取平均后作為1個輔助變量,那么X(t)=[x1(t),x2(t),x3(t),x4(t),x5(t),x6(t)]T,設置6個變量中存在的最大時滯Tmax參數值為19;
步驟2:對于每個原始變量xi,i∈{1,2,…,6},按式(1)方式分別擴展為Tmax+1維含時滯的輸入變量{xi(t-λ),λ=0,1,…,Tmax},共得到120維待分析的時滯變量集;

步驟3:根據FCA方法確定含時滯輸入變量集中每一個變量的重要性程度:
對于(xi(t),y(t)),輸入變量xi的模糊隸屬度函數定義為:
Φit(xi)=exp[-(xi(t)-xib)2]---(2)]]>
對于每一個xi,{Φit,y(t)}提供了一條模糊規則,描述為{ifxiisΦit(xi),thenyisy(t)},Φit為變量xi關于第t個數據點的輸入變量模糊隸屬度函數,式(2)選取的是高斯模糊隸屬度函數,b取變量xi值域范圍的20%。故N個訓練樣本對應每個變量都有N條模糊規則。在模糊隸屬度函數中,每個點對 應的{xi(t),y(t)}處,有Φit=1。
對于時延過程,通過引入時滯信息,原變量擴展后表示為xi(t-λ),λ=0,1,…,Tmax,λ為引入的變量時延值。通過式(3)對擴展后的每個新變量質心去模糊化,可得到第i個變量時延值為λ條件下的模糊曲線Ci,λ。如式(4)所示,di為使模糊曲線Ci,λ覆蓋范圍最大的λ,Ci,λ(λ)max和Ci,λ(λ)min為模糊曲線上點值域的最大值和最小值。
Ci,λ(λ)=Σt=1NΦit[xi(t-λ)]·y(t)Σt=1NΦit[xi(t-λ)]---(3)]]>
di=argmaxλ[Ci,λ(λ)max-Ci,λ(λ)min]---(4)]]>
若得到的Ci,λ(λ)范圍越接近y的范圍,那么輸入變量xi(t-λ)的重要程度越高,對Ci,λ(λ)覆蓋范圍進行排序,可以得到各自的重要性。基于該原理,本發明利用FCA方法提取過程各變量的最優時滯參數di并確定最優的時滯變量xi(t-di),進行軟測量建模數據重構。
步驟4:利用上一步分析得到的時滯參數d1,d2,…,dm重組用于在線建模的軟測量訓練輸入樣本集,Xd(t)=[x1(t-d1),x2(t-d2),x3(t-d3),x4(t-d4),x5(t-d5),x6(t-d6)]。如果有新的輸入樣本X(t+1)到來,則基于歷史數據庫用同樣參數進行重組,并轉到步驟5,否則,等待新數據到來。
步驟5:對重組后的建模計算時間差分,如式(5)所示,j為差分階次(j的大小可根據過程的主導變量獲得周期和性質確定):
ΔXd,j(t)=Xd(t)-Xd(t-j)
(5)
Δyj(t)=y(t)-y(t-j)
對于ΔXd,j(t)與Δyj(t)采用GPR的方法對其之間關系進行回歸,滿足Δyj(t)=f(ΔXd,j(t))+e(t),GPR方法能夠通過給定的訓練樣本的輸入輸出數據得到映射關系,便可由新的輸入數據得到相應的預測值和不確定程度,獲得具有概率意義的輸出結果。GPR算法為:
通常樣本輸出觀測值y和噪聲ε滿足式(6)關系:
y=f(x)+ϵ,ϵ~N(0,σn2)---(6)]]>
若確定均值函數和協方差函數,高斯過程的分布就能唯一確定。為了方便,通常將均值函數預處理為0。協方差函數能夠把輸出間的相關關系轉化為輸入數據之間的函數關系,由于相近的輸入產生相近的輸出,協方差函數的選擇可以根據樣本分布的特征選取,要符合距離相近的樣本間相關性大,反之相關性小的特征。本文選擇的協方差形式如式(7)所示:

式中,xp,xq∈RD,v控制協方差函數的量度,πd刻畫了每個xd的相對重要性。高斯過程的超參數的確定一般通過MLE方法對式(8)進行估計,超參數的優化,可以通過共軛梯度法實現。基于測試樣本和訓練數據,可以計算出測試數據x*預測值的后驗分布式服從式(9)的聯合高斯分布,K(X,X)為訓練樣本間的n維協方差方陣,k(x*,X)是測試樣本與訓練樣本的協方差向量,k(x*,x*)為測試樣本的自協方差值,fgp為GPR預測值。
L(Θgp)=-12yT[K(X,X)+σn2I]-1y-12logdet[K(X,X)+σn2I]-n2log2π---(8)]]>
fgp|X,y,x*~N(fgp‾,cov(fgp))s.t.fgp‾=k(x*,X)[K(X,X)+σn2In]-1ycov(fgp)=k(x*,x*)-k(X,x*)T[K(X,X)+σn2In]-1·k(X,x*)---(9)]]>
當t+1時刻的新數據到來時,采用TDGPR方法得到的預測值yj,pred(t+1)計算方式為:
ΔXj(t+1)=X(t+1)-X(t+1-j)
Δyj,pred(t+1)=fGPR(ΔXj(t+1))(10)
yj,pred(t+1)=yj(t+1-j)+Δyj,pred(t+1)
在實際工業過程中,會出現儀表損壞或實驗室分析滯后的情況,主導變量的獲得時間間隔很大且數量很少,以及數據庫中已有主導變量分析值缺失等情況。這樣一來,由圖3所示,對于新到來的測試數據X(t+1),以j時刻前數據庫保存的yj(t+1-j)為基準,可以得到t+1時刻的主導變量預測值,在線模型得到的預測輸出yj,pred(t+1)由式(10)計算,即可以得到塔底丁烷濃度的預測結果。
如圖4所示,與未引入時滯的原變量相比,6個重構變量對于主導變量的貢獻更大,為在線建模引入了更加相關的建模數據。同時,為了驗證本發明用于在線估計的有效性,選取2394組數據中的前1519組重構1500組訓練樣本,后續875組用于在線測試樣本,對丁烷濃度進行了軟測量在線預測。
圖5為經過時滯估計的FCA-TDGPR(本發明方法)與不經過時滯估計的t-TDGPR方法對于丁烷濃度的預測結果散點圖。
由圖5可知,當時間差j從1到10逐漸增加時,基于歷史數據庫進行預測的時間間隔逐步增大,預測精度不斷下降,這是因為基于越近的分析值作出的預測能夠越好地追蹤當前時刻的過程動態。
盡管兩種方法精度都在下降,但是本發明的預測結果相比于不考慮時滯的TDGPR方法,在時間差遞增時也能較好地貼近丁烷濃度真值,說明了提取的時滯信息符合過程的實際因果關系,考慮了變量時滯估計的軟測量模型預測精度更加精確。
而且驗證了通過模糊曲線分析方法確定最優時滯參數后,重構的數據對主導變量貢獻增強,因此在線模型的精度也顯著增強,同時反映了GPR方法能夠很好地解釋過程的動態變化,基于TDGPR方法的在線軟測量模型能夠自適應地基于j時刻前的歷史變量值估計當前時刻的丁烷濃度。
圖4和圖5共同驗證了基于模糊曲線分析的時間差高斯過程回歸的軟測量建模方法對于塔底丁烷濃度的在線預測具有良好的精度。

關 鍵 詞:
基于 模糊 曲線 分析 時間差 過程 回歸 測量 建模 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:基于模糊曲線分析的時間差高斯過程回歸軟測量建模方法.pdf
鏈接地址:http://www.wwszu.club/p-6405789.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大