鬼佬大哥大
  • / 22
  • 下載費用:30 金幣  

高爐鐵水硅含量四分類趨勢預報模型的建立方法及應用.pdf

關 鍵 詞:
高爐 鐵水 含量 分類 趨勢 預報 模型 建立 方法 應用
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201510340996.5

申請日:

2015.06.18

公開號:

CN104899463A

公開日:

2015.09.09

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 19/00申請日:20150618|||公開
IPC分類號: G06F19/00(2011.01)I 主分類號: G06F19/00
申請人: 中南大學
發明人: 蔣朝輝; 尹菊萍; 桂衛華; 陽春華; 謝永芳
地址: 410083湖南省長沙市麓山南路中南大學
優先權:
專利代理機構: 北京路浩知識產權代理有限公司11002 代理人: 王文君
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510340996.5

授權公告號:

||||||

法律狀態公告日:

2017.11.21|||2015.10.07|||2015.09.09

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明涉及一種高爐鐵水硅含量四分類趨勢預報模型的建立方法及應用,屬于自動化檢測技術領域。所述模型的建立方法包括采集歷史數據;進行數據預處理;確定模型輸入變量和輸出變量;依據模糊均值聚類的方法對鐵水硅含量樣本有效的聚類,獲取模型輸出變量四類趨勢變化區間的劃分標準;利用極限學習機建立四分類趨勢預報模型。利用本發明所建立的模型不僅可以預報硅含量變化的趨勢,同時可以得到趨勢變化的幅度大小,即可以預報得到下一爐鐵水硅含量是大幅上升、小幅上升、大幅下降、小幅下降的四分類趨勢變化情況。這對高爐操作者提早判斷爐況,并采取小調、早調等措施,避免爐況發生急劇變化有很好的指導。

權利要求書

權利要求書
1.  一種高爐鐵水硅含量四分類趨勢預報模型的建立方法,包括以下步驟:
S1、采集歷史數據;即采集整個煉鐵過程中影響鐵水硅含量變化的變量及鐵水硅含量數據;
S2、數據預處理;包括獲得時間點對應的時間序列樣本、剔除異常數據、確定模型輸入變量和輸出變量、歸一化處理及差分處理;經差分處理分別得到所有輸入變量的變化率,組成輸入樣本;得到所有輸出變量的變化率,組成輸出樣本;
S3、數據分類;即將所述輸出樣本依據模糊均值聚類算法劃分為四類區間;
S4、建立預報模型;即依據所述步驟S3對所述輸出樣本的四類區間劃分標準,將所述輸出樣本進行二進制編碼;然后結合所述輸入樣本利用極限學習機建立預報模型。

2.  根據權利要求1所述的建立方法,其特征在于,所述獲得時間點對應的時間序列樣本是指以一個變量的時間間隔為參照依據時間點對應對所有變量進行匹配,最終得到所需時間序列樣本。

3.  根據權利要求1-2任一項所述的建立方法,其特征在于,所述確定模型輸入變量的方法為通過相關性分析,以與鐵水硅含量的變化相關性強的變量作為所述模型輸入變量;優選結合時滯分析和/或專家經驗確定模型輸入變量。

4.  根據權利要求1-3任一項所述的建立方法,其特征在于,所述S3數據分類具體包括以下步驟:
S31、以零為邊界將所述輸出樣本劃分為兩大類,大于零和等于零的樣本劃分為正類樣本,小于零的樣本劃分為負類樣本;
S32、在所述正類樣本中獲取兩個聚類中心c1、c2,在所述負類樣本中獲取兩個聚類c′1、c′2,以這四個聚類中心得到兩個邊界值:
S33、根據步驟S32所述邊界值,將所述正類樣本和負類樣本劃分為四類區間:這四類區間依次代表四類變化趨勢:大幅下降、小幅下降、小幅上升、大幅上升。

5.  根據權利要求4所述的建立方法,其特征在于,所述S32在正類樣本中獲取兩個聚類中心c1、c2,在負類樣本中獲取兩個聚類c′1、c′2,具體包括以下步驟:
S321、初始化算法參數;具體方法如下:
初始化聚類個數c、模糊指數m、誤差ε、算法迭代次數T,初始化聚類中心V=[v1,v2,...,vc]。在[0,1]范圍內隨機初始化隸屬度矩陣U,使uij滿足公式(Ⅳ)約束條件
0<Σi=1nuij<nΣj=1cuij=10uij1,1in,1jc----(IV)]]>
其中c是聚類個數,n為樣本數,xi為聚類樣本,vi聚類中心向量,uij為第i個樣本屬于第j個中心的隸屬度,m為模糊指數,用來控制聚類的模糊程度;
S322、根據式(VII)計算K(xi,vj),式(VIII)計算參數ρ;具體方法如下,構建模糊C均值聚類算法的目標函數如下:
Jφ(U,V)=Σi=1nΣj=1cuijm||φ(xi)-φ(vj)||2---(V)]]>
式(Ⅴ)中,
||φ(xi)-φ(vj)||=K(xi,xi)+K(vj,vj)-2K(xi,vj)       (Ⅵ)
K(xi,vj)=exp{-(||xi-vj||2)/ρ2}        (VII)
ρ=Σi=1n||xi-x&OverBar;||2n,x&OverBar;=Σi=1nxin---(VIII)]]>
S323、依據式(VI)、式(VII)更新聚類中心V和隸屬度矩陣U;具體方法如下:
分別對Jφ(U,V)關于U,V求偏導,得到新的聚類中心和隸屬度,公式如下:
vj(k+1)=Σi=1n(uij(k))mK(xi,vj(k))xiΣi=1n(uij(k))mK(xi,vj(k))---(IX)]]>
uij(k+1)=(1-K(xi,vj(k+1)))-1/(m-1)Σj=1c(1-K(xi,vj(k+1)))-1/(m-1)---(X)]]>
S324、依據算法目標函數進行算法迭代;即依據S323更新一次聚類中心和隸屬度,帶入式(V)得到一個新的目標函數值;
迭代終止的條件如下:
||Jφk-Jφk-1||&epsiv;---(XI)]]>
即更新前后目標函數值的差值小于給定誤差或者達到給定的最大迭代次數時算法結束,否則繼續更新;算法迭代結束即在所述正類樣本中獲得兩個聚類中心c1、c2;在所述負類樣本中獲取兩個聚類c′1、c′2。

6.  根據權利要求1-5任一項所述的建立方法,其特征在于,所述依據步驟S3對所述輸出樣本的四類區間劃分標準,將所述輸出樣本進行二進制編碼即對所有樣本(xj,tj)的輸出tj進行二進制編碼;xj指輸入變量;tj指輸出變量;編碼矩陣如下:
M=-1-1-111-111.]]>

7.  根據權利要求1-6任一項所述的建立方法,其特征在于,所述利用極限學習機建立預報模型的過程包括:將所述輸出樣本進行二進制編碼后,對于N個不同樣本(xj,tj),其中xj=[xj1,xj2,…,xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,m=log2c,tj={-1,1},具有K個隱含層神經元數目,并且激勵函數為g(x)的ELM模型表示為:
fK(xj)=Σi=1Kβig(ωi&CenterDot;xj+bi)=h(x)β,j=1,2,...,N---(XII)]]>
式中ωi=[ω1i,ω2i,…,ωni]是連接輸入神經元和第i個隱含層神經元的ELM模 型輸入權值;bi是第i個隱元偏差;βi=[βi1,βi2,…,βim]T是連接第i個隱含層神經元和輸出神經元的ELM模型輸出權值;ωi·xj表示ωi和xj的內積,激勵函數g(x)選用sigmoid函數,即:
g(ωi&CenterDot;xi+bi)=11+exp(-(ωi&CenterDot;xj+bi))---(XIII)]]>
最小化:LpELM=12||β||2+C12Σi=1Nξi2---(XIV)]]>
使得:
h(xi)β=tiT-ξiT,i=1,2,...,N---(XV)]]>
其中:h(xi)=[g(α1xi+b1),…,g(αKxi+BK)],ξi=[ξi,1,…,ξi,m]T是樣本xi對應輸出的訓練誤差,依據KKT條件,訓練ELM等價于解決如下的對偶優化問題:引入拉格朗日乘子αi(i=1,2,…n):
LDELM=12||β||2+C12Σi=1N||ξ||2-Σi=1NΣj=1mαij(h(xi)βj-ti,j+ξi,j))---(XVI)]]>
其中,每個拉格朗日乘子αi對應第i個訓練樣本;βj連接隱含層節點到第j個輸出節點的向量,β=[β1,…,βm],相應的KKT的優化條件如下:
&PartialD;LDELM&PartialD;βj=0&DoubleRightArrow;βj=Σi=1Nαi,jh(xi)T&DoubleRightArrow;β=HTα---(XVII)]]>
&PartialD;LDELM&PartialD;ξi=0&DoubleRightArrow;αi=Cξi,i=1,2,...,N---(XVIII)]]>
&PartialD;LDEML&PartialD;αi=0&DoubleRightArrow;h(xi)β-tiT+ξiT=0,i=1,2,...,N---(XIX)]]>
將(XVII)、(XVIII)式帶入(XIX)式,得到如下方程:
(IC+HHT)α=T---(XX)]]>
其中:
T=t1T&CenterDot;&CenterDot;&CenterDot;tNT=t11...t1m&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;tN1...tNm---(XXI)]]>
將(XX)帶入(XVII)式,得到隱元偏置:
β=HT(IC+HHT)-1T---(XXII)]]>
其中:
H=h(x1)h(x2)&CenterDot;&CenterDot;&CenterDot;h(xN)=g(ω1&CenterDot;x1+b1)...g(ωK&CenterDot;x1+bK)g(ω1&CenterDot;x2+b1)...g(ωK&CenterDot;x2+bK)&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;g(ω1&CenterDot;xN+b1)...g(ωK&CenterDot;xN+bK)N×K---(XXIII)]]>
通過式(XXII)計算得到的隱層權值β,將結果帶入式(XII),得到樣本對應的輸出。

8.  根據權利要求7所述的建立方法,其特征在于,還包括對所述預報模型的輸出進行解碼的步驟;優選的解碼過程如下:給定樣本x,依據所述預報模型,得到m=log2c維的輸出向量:
f(x)=(fm(x),…,f1(x))         (XXIV)
樣本(x,i)的總損失函數定義為:
dH(M(i),y(x))=Σq=1m(1-sign(M(i,q)fq(x))2)---(XXV)]]>
M(i)指編碼矩陣c*m的第i個行向量,表示為:M(i)=(M(i,m),…,M(i,1));
基于上述損失函數,樣本x最終的類輸出為:
y^=argmini=1,2,...,cdH(M(i),y(x))---(XXVI).]]>

9.  根據權利要求1-8任一項所述的建立方法,其特征在于,用狀態轉移算法對所述預報模型的輸入權值和隱元偏差進行優化,得到最優的輸入權值和隱元偏差;優選所述優化具體流程如下:
輸入:隨機產生ELM的輸入權值ωK*n和隱元偏差βK*m;
輸出:最優ELM輸入權值和隱元偏差;
Step1:初始化搜索力度SE,問題維數Dim,搜索范圍,迭代次數,極限學習機中的輸入權值和隱元偏差以及隱含層節點數K;
Step2:引入STA算法,將初始化得到的輸入權值和隱元偏差作為STA的輸入樣本,均方根誤差MSE作為STA算法的目標函數;
Step3:如果算法滿足收斂精度或是達到了最大的迭代次數,轉step6,否則轉step4;
Step4:對STA算法中的樣本執行:
Step41擴張轉變
xk+1=xk+γRcxk          (XXVII)
其中,γ是一個正常數,稱為擴張因子;Rc∈Rn*n是一個隨機對角矩陣,
其中每一個元素都服從高斯分布;
Step42旋轉轉變
xk+1=xk+α1n||xk||2Rrxk---(XXVIII)]]>
其中,xk∈Rn,α代表正常數,稱為旋轉因子;Rr∈Rn*n是一個隨機矩陣,服從[-1,1]的均勻分布,||·||2代表二范數;
Step43壓縮轉變
xk+1=xk+δRaxk           (XXIX)
其中,δ是一個正常數,稱為壓縮因子;Ra∈Rn*n是一個隨機對角矩陣,
其中每一個元素都服從高斯分布,并且只有一個隨機位置是非零值;
Step5:判斷算法是否滿足運行的終止條件,終止條件為最大的迭代次數以及算法的精度,若是滿足,轉step6,否則g=g+1,轉step4;
Step6:輸出STA算法的最優值,即ELM的輸入權值和隱元偏差。

10.  一種高爐鐵水硅含量四分類趨勢預報方法,包括按權利要求1-9任一項所述方法建立高爐鐵水硅含量四分類趨勢預報模型,選取一組變量數據作為輸入變量,輸入到所述預報模型,得到高爐鐵水硅含量四分類趨勢預報結果;優選地,選取的輸入到所述預報模型的輸入變量與建立所述預報模型時采用的輸入變量相同。

說明書

說明書高爐鐵水硅含量四分類趨勢預報模型的建立方法及應用
技術領域
本發明涉及一種高爐冶煉過程中鐵水硅含量趨勢預報模型的建立方法及應用,屬于自動化檢測技術領域。
背景技術
鐵水硅含量是表征高爐煉鐵過程爐溫及其變化趨勢的關鍵信息,也是反應鐵水質量、能耗等指標的重要物理量。但鐵水硅含量及其變化趨勢無法直接在線檢測,導致對爐況調控不及時或者盲目,致使爐溫大幅波動、爐況不順,若爐溫過低,則鐵水物理熱不足,爐缸熱儲備不夠,不僅鐵水質量差,且容易造成嚴重的爐缸凍結事故;若爐溫過高,則爐內煤氣流太過旺盛,導致懸料、崩料等事故,嚴重影響高爐的焦比、排放。因此研究如何實時預報鐵水硅含量及其變化趨勢,對穩定高爐熱狀態、減少爐況的波動、提高生鐵質量和降低焦比等具有重要意義。
目前,對高爐鐵水硅含量的預測可分為兩大方向,一是利用檢測得到的大量數據建立基于數據驅動的數值預測模型,也稱為黑箱模型。常用的黑箱模型有:時間序列預測模型、神經網絡預測模型、混沌模型、SVM預測模型、非線性動力學理論預測模型等。二是通過將高爐鐵水硅含量的數值轉變為上升和下降的趨勢變化,進而建立鐵水硅含量的二分類趨勢預報。目前,關于鐵水硅含量趨勢預報方面的文獻還比較少,而實際應用中,高爐工廠一般根據經驗判斷爐溫的變化趨勢,進而進行操作調節。
基于數據驅動的預測模型以鐵水硅含量為高爐爐溫的衡量標準,研究高爐冶煉過程參數與硅含量的函數關系,是一種僅依賴于系統輸入輸出的黑箱模型方法,對高爐鐵水硅含量的預報有一定的效果,但是仍存在自身局限性,如時間序列模型更適應于爐況平穩的情形;神經網絡能夠獲得比時間序列更好的預測效果,但是在實際應用中學習時間長且容易產生擬合現象;SVM的預測模型具有很好的泛化性能,在大多數情況下能獲得優于其他方法的預測效果。
然而,上述的數據驅動模型主要集中在鐵水硅含量的數值預測上,很少關 注趨勢的變化。盡管數值預測給出了鐵水硅含量直接的結果,但是數值預測結果有時候會對鐵水硅含量趨勢的變化無法做出診斷或者做出錯誤的診斷。例如,在連續的兩爐鐵水中硅含量數值的變化很小,甚至比評價是否成功命中的臨界值都小,這種情況下沒有必要去構建數值預測模型,因為單一的預測模型完全依據目標命中率來評判,而此時的命中率雖然顯示成功命中,卻無法表針硅含量的這種微小變化,從這一點也可以得到,預測高爐爐缸熱狀態,也就是預測高爐鐵水硅含量的趨勢變化至關重要。
目前,對鐵水硅含量的趨勢變化的研究主要集中在二分類預報問題(即鐵水硅含量上升和下降),但是二分類的預報只能得到趨勢變化的方向,無法得到這種方向變化的幅度。
中國專利申請公布號CN 103160629 A,申請公布日2013.06.19,公開了一種預報高爐趨熱的方法,其綜合考慮了整個煉鐵工藝中影響鐵水硅含量的因素。通過建立三個預測模型,分別為:高爐鐵水中的Si含量的RBF神經網絡計算模型、高爐料速計算模型、理論燃燒溫度計算模型,然后利用這三個模型對高爐趨熱結果的判斷,最終得到高爐是否趨熱。但是該方法僅僅可以預測高爐是否趨熱,對于其他變化趨勢無法得到判斷,比如高爐是否趨冷,或者趨熱趨冷的程度等等,都無法得到準確的信息。
中國專利申請公布號CN103160626 A,申請公布日2013.06.19,公開了一種判斷高爐爐缸過涼的方法,該方法與CN 103160629 A類似,不同點在于該方法揭示了一種判斷高爐爐缸過涼的方法。分別從物理傳熱、化學傳熱、歷史數據等影響高爐向涼發展的角度出發,建立了三個預測模型,分別為:高爐鐵水中的Si含量的RBF神經網絡計算模型、高爐料速計算模型、理論燃燒溫度計算模型。綜合三個模型所得結果判斷高爐爐缸是否過涼。但是該方法也是只能判斷一種爐溫變化情況,無法獲取爐溫是否趨熱、以及趨冷趨熱程度的變化信息。另外,三個模型得到的數值對鐵水硅含量影響的權重判斷無法準確劃分,這對預報結果的命中率有一定影響。
中國專利申請公布號CN10211383A,申請公布日2008.7.2,公開了一種高爐鐵水硅含量的特征分析預報方法,該方法建立了一種高爐鐵水硅含量的預報模型,采取改進的動態獨立成分分析方法對輸入變量的樣本數據進行特征提取, 提取了測量對象的高階統計信息,通過小樣本建模設計的基于遺傳算法優化的最小二乘支持向量機方法建立鐵水硅含量預報回歸模型。但是該方法只能預測得到下一爐鐵水硅含量的數值,無法準確判斷爐溫的變化,更無法獲取爐溫趨勢的變化程度,可以反饋給高爐操作者的信息少,可靠性不高。
中國專利申請公布號CN102031319A,申請公布日20011.04.27,公開了一種高爐鐵水硅含量的預報方法,該方法將爐況分為小波動和大波動兩種情況分別建模,分別對爐況穩定和波動都進行了預報,當爐況波動較小時主要依靠均線系統,在爐況波動大時自動加入風口理論燃燒溫度以及前次鐵水含硫量,達到預測鐵水硅含量的目的。該方法雖然綜合考慮了爐況穩定和異常兩種情況,但是在實際應用中,無法提前預判何時出現異常爐況,進而也就無法及時更換預測模型,對結果的命中率有一定影響。
綜上所述,現有的各種預測爐溫的方法,或無法全面預報,或只能預報數值,而對于爐溫趨勢預報的方法較少。
發明內容
本發明的目的是提出一種高爐鐵水硅含量四分類趨勢預報模型的建立方法及應用,根據與高爐鐵水硅含量有密切關系的可控以及不可控變量的歷史數據,利用極限學習機(extreme learning machine,ELM)建立四分類趨勢預報模型,優選并采用狀態轉移算法優化模型參數,進而利用所建模型來預報未來一段時間硅含量的變化趨勢。利用本發明所建立的模型不僅可以預報硅含量變化的趨勢,同時可以得到趨勢變化的幅度大小,即可以預報得到下一爐鐵水硅含量是大幅上升、小幅上升、大幅下降、小幅下降的四分類趨勢情況。這對高爐操作者提早判斷爐況,并采取小調、早調等措施,避免爐況發生急劇變化有很好的指導。
本發明目的是通過以下技術方案實現的,一種高爐鐵水硅含量四分類趨勢預報模型的建立方法,包括:采集歷史數據;進行數據預處理,以確定模型輸入變量(即鐵水硅含量影響因子)和輸出變量;優選結合時滯分析和\或專家經驗分析確定模型輸入變量;依據模糊均值聚類的方法對鐵水硅含量樣本有效的聚類,達到對數據集進行正確的分類,獲取模型輸出變量——鐵水硅含量的四類趨勢變化區間的劃分標準,即大幅上升、小幅上升、大幅下降、小幅下降的 評判指標;利用極限學習機建立四分類趨勢預報模型即ELM分類器;優選采用狀態轉移算法優化所述預報模型參數。
具體地,所述高爐鐵水硅含量四分類趨勢預報模型的建立方法,包括以下步驟:
S1、采集歷史數據
所述采集歷史數據為采集整個煉鐵過程中影響鐵水硅含量變化的變量及鐵水硅含量數據。
由于高爐內部的復雜物理化學反應,其間接影響鐵水硅含量變化的變量有很多,包括上部的布料方式、原料性質,下部的控制參數如風量、風溫等。常用的變量數據有富氧率、透氣性指數、標準風速、富氧流量、冷風流量、噴煤量、鐵水成分、煤氣成分、頂壓、全壓差、熱風壓力、實際風速、冷風壓力、理論燃燒溫度、熱風溫度、鼓風動能、富氧流量、富氧壓力、爐腹煤氣量等等。
S2、數據預處理
所述數據預處理即通過對現場煉鐵工藝了解,對可采集到的歷史數據進行分析,獲得時間點對應的時間序列樣本、剔除異常數據、確定模型輸入變量(即與鐵水硅含量相關性強的變量)和輸出變量、歸一化處理及差分處理。具體包括以下步驟:
S21、獲得時間點對應的時間序列樣本;
采集歷史數據時,不同變量有不同的采樣周期(或間隔),因此在數據預處理之前需要折中考慮。以一個變量的時間間隔為參照(例如以采樣周期最長的變量的時間間隔,本發明的一種具體實施方式為1h),依據時間點對應對所有變量進行匹配,最終得到所需時間序列樣本。比如:鐵水成分(如:Si,Ti,S,P,Mn)的采集周期大概為40min,煤氣成分(如:H2,CO,CO2)的采集周期為1s,噴煤量的采集周期為30min,而一些控制變量(噴煤量、熱風溫度、富氧量、風量等)和狀態變量(透氣性指數、爐頂溫度)的采集周期為1h。在建立本發明所述模型時,需要相同時間點對應的各個變量值作為模型的一個輸入樣本。本發明的一種實施方式中以最長的采集周期1h為參照,通過時間點對應對所有變量進行匹配,最終提取時間序列樣本。
S22、剔除異常數據;
在采樣過程中,受到高溫高壓等環境影響或者高爐休風、減風等非正常狀況,數據存在異常值。這些異常數據在一定程度上會改變數據的變化趨勢,影響模型建立的準確性,因此需要對異常數據進行剔除。
本發明通過3σ準則進行異常值(和缺失值)處理,剔除異常數據,即若殘差|Vi|>3σ,則該數據為異常數據,該樣本為異常樣本,予以剔除。重復使用該方法剔除異常數據,直至沒有異常數據為止。
其中:
σ=(Σi=1NVi2)/(N-1)---(I)]]>
xi為所處理的數據,N為樣本個數。為xi的殘差。
S23、確定模型輸入變量和輸出變量;
對所有采集到的影響鐵水硅含量變化的變量與鐵水硅含量之間進行相關性分析,以與鐵水硅含量的變化相關性強的變量,作為本發明所述模型的輸入變量;以鐵水硅含量作為輸出變量。由于高爐內部的復雜物理化學反應,其間接影響鐵水硅含量的因素有很多,包括上部的布料方式、原料性質,下部的控制參數如風量、風溫等。本發明在建立所述模型時,將影響鐵水硅含量的變化強的變量作為模型輸入變量,將鐵水硅含量作為模型輸出變量。鐵水中硅含量的變化與固體原料,包含鐵礦石、燒結礦和焦炭;待加熱的氣態物質,包含空氣和一些輔助燃料;以及下部的風量、風溫等參數的變化有密切的關系。表1列出了20個待選變量。過多的輸入變量會增加模型的復雜度,而過少的輸入變量又會降低模型精度。因此,在建立模型時有必要刪除待選變量中與鐵水硅含量相關性不強的變量。本發明在一種具體實施方式中,通過SPSS(Statistical Product and Service Solutions,即“統計產品與服務解決方案”軟件),計算了所有待選變量與鐵水硅含量的相關系數,結果如表1所示。
值得說明的是,雖然透氣性指數與硅含量的相關性系數不高,但在實際高爐調控中,它是現場操作者判斷鐵水硅含量變化的重要依據之一,因此,本發明在建模時也將其作為模型輸入變量。
同時,由于高爐自身特點所決定,高爐的工藝參數對高爐爐溫[Si]具有時滯 影響,即存在一定的滯后性,及存在滯后時間。所謂的滯后時間指的是某一參數的變化將在n小時或n分鐘之后才會導致高爐爐溫[Si]發生變化。那么所謂的滯后時間也可以這樣理解,某一時刻的高爐爐溫[Si]受n小時或n分鐘以前的工藝參數的影響,對應著那一段時間的工藝參數,相關性是最大的,也是最密切的。因此,要確定相關變量的滯后時間,需要借助于高爐現場專家人員的經驗及相關性分析的手段。具體地,本發明通過SPSS進行時滯分析,得到上一爐鐵水硅含量與本爐鐵水硅含量有很強的相關性,因此,將上一爐鐵水硅含量也作為待選變量進行選擇。本發明在建模時也將時滯(即上一爐鐵水硅含量)作為模型輸入變量。同時,專家經驗具有重要參考價值,也是值得考慮的重要因素。優選地,本發明同時結合時滯分析和/或專家經驗確定模型輸入變量。綜上,在本發明的一種具體實施方式中,結合相關性分析、時滯分析以及專家經驗得到一種優選的方案是選取富氧率、透氣性指數、鼓風動能、全壓差、熱風溫度、噴煤量、利用系數、冷風流量以及上一爐鐵水硅含量共9個變量作為模型的輸入變量。
表1輸入變量與硅含量相關性系數

S24、歸一化處理;
即將各輸入變量分別歸一化處理;優選地,將輸出變量(即鐵水硅含量)也進行歸一化處理。因選取的各輸入變量量綱不同,對模型的收斂速度和復雜度有很大影響,在建模前需要對其分別進行歸一化處理。通過數值變換來消除變量間的量綱影響。方法如下:

其中xi,分別為第i個變量歸一化前、后取值,max(xi),min(xi)分別為第i個變量歸一化前的最大值、最小值。
S25、差分處理;
即分別對各輸入變量和輸出變量進行差分處理(例如進行前向差分)得到所有變量的變化率;這樣處理可以更好的與趨勢變化相吻合。前向差分公式如下:
Δxi=xi-xi-1,  i=1,2,…,n    (Ⅲ)
經差分處理分別得到所有輸入變量的變化率,組成輸入樣本;得到所有輸出變量(即鐵水硅含量)的變化率,組成輸出樣本。
S3、數據分類
所述數據分類即將所述輸出樣本依據模糊均值聚類算法劃分為四類區間;具體包括以下步驟:
S31、以零為邊界將所述輸出樣本劃分為兩大類,大于零的樣本劃分為第一類,簡稱為正類樣本,小于零的樣本劃分為第二類,簡稱為負類樣本。本發明將等于零的樣本劃分為正類樣本。
S32、在所述正類樣本中獲取兩個聚類中心c1、c2,在所述負類樣本中獲取兩個聚類c′1、c′2,以這四個聚類中心得到兩個邊界值:
S33、根據步驟S32所述邊界值,將所述正類樣本和負類樣本劃分為四類區間:[-1,-c1+c22],[-c1+c22,0],[0,c1+c22],[c1+c22,1];]]>這四類區間依次代表四類變化趨勢:大幅下降、小幅下降、小幅上升、大幅上升。
所述S32在正類樣本中獲取兩個聚類中心c1、c2,在負類樣本中獲取兩個聚類c′1、c′2,具體包括以下步驟:
S321、初始化算法參數;具體方法如下:
初始化聚類個數c、模糊指數m、誤差ε、算法迭代次數T,初始化聚類中心V=[v1,v2,...,vc]。在[0,1]范圍內隨機初始化隸屬度矩陣U,使uij滿足公式(Ⅳ)約束條件
0<Σi=1nuij<nΣj=1cuij=10uij11in,1jc---(IV)]]>
其中c是聚類個數,n為樣本數,xi為聚類樣本,vi聚類中心向量,uij為第i個樣本屬于第j個中心的隸屬度,m為模糊指數,用來控制聚類的模糊程度。
S322、根據式(VII)計算K(xi,vj),式(VIII)計算參數ρ;具體方法如下:
構建模糊C均值聚類算法的目標函數如下:
Jφ(U,V)=Σi=1nΣj=1cuijm||φ(xi)-φ(vj)||2---(V)]]>
式(Ⅴ)中,
||φ(xi)-φ(vj)||=K(xi,xi)+K(vj,vj)-2K(xi,vj)    (Ⅵ)
K(xi,vj)=exp{-(||xi-vj||2)/ρ2}    (VII)
ρ=Σi=1n||xi-x&OverBar;||2n,x&OverBar;=Σi=1nxin---(VIII)]]>
依據S321和S322將所述正類樣本和所述負類樣本初步劃分在不同類別中,然而,這種初步劃分準確性不高。因此,通過如下公式更新聚類中心和隸屬度,為步驟S324的進一步劃分提供條件。
S323、依據式(VI)、式(VII)更新聚類中心V和隸屬度矩陣U;具體方法如下:
分別對Jφ(U,V)關于U,V求偏導,得到新的聚類中心和隸屬度,公式如下:
vj(k+1)=Σi=1n(uij(k))mK(xi,vj(k))xiΣi=1n(uij(k))mK(xi,vj(k))---(IX)]]>
uij(k+1)=(1-K(xi,vj(k+1)))-1/(m-1)Σj=1c(1-K(xi,vj(k+1)))-1/(m-1)---(X)]]>
S324、依據算法目標函數進行算法迭代;即依據S323更新一次聚類中心和隸屬度,帶入式(V)便得到一個新的目標函數值。
迭代終止的條件如下:
||Jφk-Jφk-1||&epsiv;---(XI)]]>
即更新前后目標函數值的差值小于給定誤差或者達到給定的最大迭代次數時算法結束,否則繼續更新。
算法迭代結束即可以在所述正類樣本中獲得兩個聚類中心c1、c2;在所述負類樣本中獲取兩個聚類c′1、c′2。
S4、建立預報模型
即依據所述步驟S3對所述輸出樣本的四類區間劃分標準,將所述輸出樣本進行二進制編碼;然后結合所述輸入樣本利用極限學習機建立預報模型。所述建立預報模型具體包括以下步驟:
S41、編碼;
即依據上述步驟S3對對輸出樣本的四類區間劃分標準,將所有輸出樣本進行二進制編碼。所述輸出樣本的四類區間劃分標準為:這四類區間依次代表四類變化趨勢:大幅下降、小幅下降、小幅上升、大幅上升。
也就是說,對所有樣本(xj,tj)的輸出tj進行二進制編碼。xj指輸入變量;tj指輸出變量(即鐵水硅含量變化率)。對c類分類問題,需要[log2c]個字節編碼c個不同的類。本發明中的四分類問題,輸出編碼如下表1所示:
表1四分類編碼

其中:f2代表趨勢變化方向,該列中“-1”代表下降,“1”代表上升;f1代表趨勢變化幅度,該列中“-1”代表小幅變化,“1”代表大幅變化。因此得到編碼矩陣:
M=-1-1-111-111.]]>
通過如上編碼,將所有輸出樣本tj(即鐵水硅含量)按編碼的不同依次劃分在各自的類中。例如其中每一個輸出值tj都由兩個編碼字節組成。
S42、利用極限學習機(ELM)建立預報模型;所述建立好的預報模型也稱ELM分類器;具體過程包括:經過上述編碼,對于N個不同樣本(xj,tj),其中xj=[xj1,xj2,…,xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,m=log2c,tj={-1,1},具有K個隱含層神經元數目,并且激勵函數為g(x)的ELM模型可以表示為:
fK(xj)=Σi=1Kβig(ωi&CenterDot;xj+bi)=h(x)β,j=1,2,...,N---(XII)]]>
式中ωi=[ω1i,ω2i,…,ωni]是連接輸入神經元和第i個隱含層神經元的ELM模型輸入權值;bi是第i個隱元偏差;βi=[βi1,βi2,…,βim]T是連接第i個隱含層神經元和輸出神經元的ELM模型輸出權值;ωi·xj表示ωi和xj的內積,激勵函數g(x)選用sigmoid函數,即:
g(ωi&CenterDot;xj+bi)=11+exp(-(ωi&CenterDot;xj+bi))---(XIII)]]>
最小化:LpELM=12||β||2+C12Σi=1Nξi2---(XIV)]]>
使得:
h(xi)β=tiT-ξiT,i=1,2,...,N---(XV)]]>
其中:h(xi)=[g(α1xi+b1),…,g(αKxi+BK)],ξi=[ξi,1,…,ξi,m]T是樣本xi對應輸出的訓練誤差,依據KKT條件(庫恩塔克條件,即Karush-Kuhn-Tucker Conditions),訓練ELM等價于解決如下的對偶優化問題:引入拉格朗日乘子αi(i=1,2,…n):
LDELM=12||β||2+C12Σi=1N||ξ||2-Σi=1nΣj=1mαij(h(xi)βj-ti,j+ξi,j))---(XVI)]]>
其中,每個拉格朗日乘子αi對應第i個訓練樣本。βj連接隱含層節點到第j個輸出節點的向量,β=[β1,…,βm],相應的KKT的優化條件如下:
&PartialD;LDELM&PartialD;βj=0&DoubleRightArrow;βj=Σi=1Nαi,jh(xi)T&DoubleRightArrow;β=HTα---(XVII)]]>
&PartialD;LDELM&PartialD;ξi=0&DoubleRightArrow;αi=Cξi,i=1,2,...,N---(XVIII)]]>
&PartialD;LDELM&PartialD;αi=0&DoubleRightArrow;h(xi)β-tiT+ξiT=0,i=1,2,...,N---(XIX)]]>
將(XVII)、(XVIII)式帶入(XIX)式,得到如下方程:
(IC+HHT)α=T---(XX)]]>
其中:
T=tiT...tNT=t11...t1m.........tN1...tNm---(XXI)]]>
將(XX)帶入(XVII)式,得到隱元偏置:
β=HT(IC+HHT)-1T---(XXII)]]>
其中:
H=h(x1)h(x2)...h(xN)=g(ω1&CenterDot;x1+b1)...g(ωK&CenterDot;x1+bK)g(ω1&CenterDot;x2+b1)...g(ωK&CenterDot;x2+bK)......g(ω1&CenterDot;xN+b1)...g(ωK&CenterDot;xN+bK)N×K---(XXIII)]]>
通過式(XXII)計算得到的隱層權值β,將結果帶入式(XII),得到(測試樣本)對應的輸出。
ELM的網絡結構圖1所示。
優選地,本發明所述高爐鐵水硅含量四分類趨勢預報模型的建立方法還包括解碼的步驟;所述解碼是指對建立好的預報模型(即ELM分類器)的輸出進行解碼,即對步驟S42得到的(測試樣本)輸出進行解碼。
優選地,所述建立預報模型還包括訓練和測試的步驟;
所述測試樣本就是用來檢測模型準確性的樣本。也就是說,先用一大批歷史數據(稱為訓練樣本,包含輸入變量和輸出變量,都是已知的)對上述建立好的預報模型進行訓練,訓練好之后就需要用另一批數據(稱為測試樣本,也包含輸入變量和輸出變量)對所訓練好的所述模型進行測試。測試的時候只需將輸入變量帶入所述模型,該模型會得到相應的輸出,然后用該模型得到的輸出與實際的輸出比較,進而得到結果的準確性,如果準確性高,說明所建模型好,可以用于現場對高爐鐵水硅含量進行預測,如果不高,則繼續修正模型參數。
以下以測試樣本為例,對解碼步驟進行描述:
如圖2所示,測試樣本指圖2中的②對應的那部分數據,測試樣本的輸出即由本發明預報模型(上述步驟S42所建立的ELM分類器)計算得到的鐵水硅含量變化趨勢。
給定測試樣本x,依據上述建立好的預報模型(ELM分類器),得到m=log2c維的輸出向量:
f(x)=(fm(x),…,f1(x))    (XXIV)
這些輸出需要解碼才能得到樣本x最終所屬的類。在此,運用基于損失函數的解碼方法對ELM分類器的輸出進行解碼。在這種解碼方法中,如要樣本x被標簽為i類,樣本(x,i)的總損失函數值最小。樣本(x,i)的總損失函數定義為:
dH(M(i),y(x))=Σq=1m(1-sign(M(i,q)fq(x))2)---(XXV)]]>
M(i)指的是編碼矩陣c*m的第i個行向量,表示為:M(i)=(M(i,m),…,M(i,1))。
基于上述損失函數(方程(XXV)),訓練樣本x最終的類輸出為:
y^=argmini=1,2,...,cdH(M(i),y(x))---(XXVI)]]>
式(XXVI)也稱決策函數。
依據上述描述得到如下ELM分類過程:
輸入:訓練集Xtrain;輸出:訓練集Ytrain;
輸入:測試集Xtest;輸出:測試集Ytest;
Step1:編碼過程,依據編碼矩陣對訓練集類別Ytrain進行編碼;
Step2:訓練過程,得到隱含層輸出矩陣H以及連接隱含層節點和輸出層節點的權值β,即完成圖2中的①部分;
Step3:測試過程,輸入測試集,即圖2中的②部分,基于上述參數,獲得ELM的輸出,即圖2中的③部分;
Step4:解碼過程,將上述輸出依據式(XXV)的損失函數以及式(XXVI)的決策函數得到測試集所屬的類別。
建立所述預報模型(即ELM分類器)時,由于模型的輸入權值和隱元偏差理論上可以隨機賦值得到,這無疑是ELM的一個較大的缺陷,使得預報結果出現了很大的不穩定性,對高爐煉鐵過程中鐵水硅含量的趨勢預報帶來了很大的影響。因此,如何設置影響算法性能的關鍵參數,對預測模型的學習精度和泛化能力的好壞起著決定性作用。優選地,本發明用狀態轉移算法(STA)優化得到輸入權值和隱元偏差,不僅可以提高模型穩定性,而且使得模型的預測結果更可靠。具體流程如下:
輸入:隨機產生ELM的輸入權值ωK*n和隱元偏差βK*m;
輸出:最優ELM輸入權值和隱元偏差;
Step1:初始化搜索力度SE,問題維數Dim,搜索范圍,迭代次數,極限學 習機中的輸入權值和隱元偏差以及隱含層節點數K;
Step2:引入STA算法,將初始化得到的輸入權值和隱元偏差作為STA的輸入樣本,均方根誤差MSE作為STA算法的目標函數;
Step3:如果算法滿足收斂精度或是達到了最大的迭代次數,轉step6,否則轉step4;
Step4:對STA算法中的樣本執行:
Step41擴張轉變(expend transformation)
xk+1=xk+γRcxk    (XXVII)
其中,γ是一個正常數,稱為擴張因子;Rc∈Rn*n是一個隨機對角矩陣,其中每一個元素都服從高斯分布。擴張轉變的功能是將xk的范圍擴張到[-∞,+∞],即在整個空間搜索。
Step42旋轉轉變(rotation transformation)
xk+1=xk+α1n||xk||2Rrxk---(XXVIII)]]>
其中,xk∈Rn,α代表正常數,稱為旋轉因子。Rr∈Rn*n是一個隨機矩陣,服從[-1,1]的均勻分布,||·||2代表二范數。旋轉轉變可以在超平面進行搜索。
Step43壓縮轉變(axesion transformation)
xk+1=xk+δRaxk    (XXIX)
其中,δ是一個正常數,稱為壓縮因子;Ra∈Rn*n是一個隨機對角矩陣,其中每一個元素都服從高斯分布,并且只有一個隨機位置是非零值。壓縮轉變目的是搜索中心,增強單維搜索。
Step5:判斷算法是否滿足運行的終止條件,一般終止條件為最大的迭代次數以及算法的精度,若是滿足,轉step6,否則g=g+1,轉step4;
Step6:輸出STA算法的最優值,即ELM的輸入權值和隱元偏差。
本發明還包括按上述方法所建立的預報模型在高爐鐵水硅含量四分類趨勢預報方面的應用。
進一步,本發明還提供一種高爐鐵水硅含量四分類趨勢預報方法,包括按 上述方法建立高爐鐵水硅含量四分類趨勢預報模型,選取一組變量數據作為輸入變量,輸入到所述預報模型,得到高爐鐵水硅含量四分類趨勢預報結果;優選地,選取的輸入到所述預報模型的輸入變量與建立所述預報模型時采用的輸入變量相同;所述變量相同是指變量名稱相同,并非指變量數據相同;例如,建立所述預報模型時選取的變量為富氧率、透氣型指數、鼓風動能、全壓差、熱風溫度、噴煤、利用系數、冷風流量以及上一爐鐵水硅含量共9個變量,那么在利用所述模型進行實際預報時也選取這9個變量,將其具體數據輸入所述模進行預報;優選地,按上述方法對所述預報模型的輸出進行解碼,得到該輸出所屬的類別,即可得到該輸出的四分類趨勢。
本發明所述高爐鐵水硅含量四分類趨勢是指大幅上升、小幅上升、大幅下降、小幅下降。
本發明的關鍵點
1、本發明通過分析高爐內部的復雜物理化學反應以及高爐煉鐵原理,獲取了影響鐵水硅含量的各種變量在一段時間內的數據,這些變量包括上部的布料方式、原料性質,下部的風溫、風量等變量。通過時間點對應選取所需樣本,依據拉伊達準則進行異常值處理,通過SPSS分析采集到的各變量與鐵水硅含量之間的相關性系數以及時滯影響,得到與鐵水硅含量有強相關性的變量作為所建模型的輸入變量。
2、本發明采用模糊均值聚類算法確定區間劃分依據,首先對歷史數據進行聚類劃分,形成若干個子樣本集,其次對模型輸出樣本集進行區間劃分,最終確定了模型輸出變化趨勢的四類區間的劃分依據。
3.本發明采用二進制代碼對上述四類進行編碼,得到編碼矩陣。用編碼區分不同的類,更容易建立模型,也更容易識別輸出類別。在對模型輸出進行解碼時,運用漢明距離來衡量模型輸出與編碼矩陣之間的相似程度,進而確定模型輸出所屬的類。
4、采用極限學習機對樣本集進行建模,將經過異常值處理后的樣本劃分為訓練集和測試集。為了避免極限學習機在參數選取上的隨機性,進而造成結果的不穩定,本發明通過狀態轉移算法優化極限學習機的輸入權值和隱元偏差。通過訓練集對模型進行訓練,獲得鐵水硅含量趨勢變化幅度的分類器。再通過 測試集進行鐵水硅含量四分類趨勢變化的準確性驗證。
本發明的效果
本發明基于采樣數據以及煉鐵工藝的特點,以每爐次出鐵時間為周期,時間點對應的方式選取數據樣本,采用SPSS選取模型輸入變量,并用模糊均值聚類的方法確定了模型輸出變量的四分類趨勢變化的控制邊界。通過STA-ELM建模方法實現鐵水硅含量四分類趨勢預測的目的,本發明充分利用高爐可檢測到的影響鐵水硅含量的數據,使得鐵水硅含量的趨勢預測結果命中率更高,對高爐操作現場有更好的指導作用。
附圖說明
圖1為本發明ELM網絡結構圖。
圖2為本發明STA-ELM趨勢預測流程圖。
圖3為本發明模糊均值聚類劃分區間圖。
圖4為本發明STA-ELM模型優化過程示意圖。
圖5為本發明實施例2樣本實際鐵水硅含量變化趨勢圖。
圖6為本發明實施例2樣本預測鐵水硅含量變化趨勢圖。
圖5和圖6中:縱軸“1”“2”“3”“4”分別代表大幅下降、小幅下降、大幅上升、小幅上升;橫軸代表爐次。
具體實施方式
以下實施例用于說明本發明,但不用來限制本發明的范圍。
實施例1
本實施例在某鋼廠2650m3高爐進行試驗測試。
一種高爐鐵水硅含量四分類趨勢預報模型的建立方法,具體包括如下步驟:
1)采集歷史數據。通過自動化系統的組態軟件實現煉鐵過程控制及數據采集。所述的自動化系統包括高爐本體、上料系統、熱風爐系統、噴煤系統組成。其中來自高爐本體的數據主要由:爐頂壓力、熱風壓力、爐頂溫度等相關數據。來自熱風爐系統的數據主要有:高爐煤氣量、送風、爐頂溫度、煙道溫度等送風相關數據。來自噴煤系統的數據主要有:噴吹壓力、噴吹流量等噴煤有關的數據。
2)數據預處理。將上述采集到的數據進行數據預處理。具體包括:
①獲得時間點對應的時間序列樣本,即通過時間點對應選取樣本。以最長的 采集周期1h為參照,通過時間點對應對所有采集到的變量進行時間點匹配,提取時間序列樣本,本實施例最終提取931個時間序列樣本。
②利用3σ準則刪除異常數據。通過異常值處理,本實施例共剔除31個異常數據。
③確定模型輸入變量和輸出變量。本實施例通過SPSS選取的模型輸入變量為:富氧率、透氣型指數、鼓風動能、全壓差、熱風溫度、噴煤、利用系數、冷風流量以及上一爐鐵水硅含量共9個變量作為模型的輸入變量。
④歸一化處理。
⑤差分處理。本實施例通過前向差分對所有變量進行差分,得到變化率。所有輸入變量的變化率,組成輸入樣本;所有輸出變量的變化率,組成輸出樣本。
3)模糊均值聚類得到趨勢變化區間。通過模糊均值聚類對輸出樣本(鐵水硅含量)進行聚類劃分,最終確定四個趨勢變化區間為:這四個區間分別對應趨勢變化的:大幅下降、小幅下降、
小幅上升、大幅上升。
4)建立預報模型
①編碼:對數據預處理之后的輸出樣本通過編碼矩陣進行二進制編碼。
②建立預報模型。利用狀態轉移算法優化極限學習機的輸入權值和隱元偏差,建立優化極限學習機的預報模型。將數據預處理后的900組樣本劃分為訓練樣本和測試樣本,選取前700組作為訓練樣本,用來訓練模型參數,后200組作為測試樣本,用來驗證模型準確性。通過不斷修正模型參數,得到最優的預報模型。
實施例2
本實施例涉及一種利用實施例1所建立高爐鐵水硅含量四分類趨勢預報模型對高爐鐵水硅含量四分類趨勢預報方法,具體為選取一組變量數據作為輸入變量,輸入到所述預報模型,對預報模型的輸出結果進行解碼,得到最終的硅含量變化趨勢(高爐鐵水硅含量四分類趨勢預報結果)。
具體而言,選取了從2013年1月9號21:00到2013年2月27號10:00總共1166組數據利用實施例1所述數據處理方法進行處理。其中200組測試樣本對 應的實際鐵水硅含量變化趨勢如圖5所示,由圖5可知,變化趨勢大多都落在小幅上升和小幅下降的區間內,只有小部分樣本落在大幅上升和大幅下降的區間,這也說明爐況比較穩定,符合現場實際情況。利用實施例1所建立的高爐鐵水硅含量四分類趨勢預報模型進行預報,預報結果如圖6所示。對比圖5和圖6,可見大多爐次趨勢預測都準確,表明本實施例預報結果與實際值相吻合,符合實際要求,取得了滿意的預報效果。
雖然,上文中已經用一般性說明及具體實施方案對本發明作了詳盡的描述,但在本發明基礎上,可以對之作一些修改或改進,這對本領域技術人員而言是顯而易見的。因此,在不偏離本發明精神的基礎上所做的這些修改或改進,均屬于本發明要求保護的范圍。

關于本文
本文標題:高爐鐵水硅含量四分類趨勢預報模型的建立方法及應用.pdf
鏈接地址:http://www.wwszu.club/p-6369505.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大