鬼佬大哥大
  • / 9
  • 下載費用:30 金幣  

一種基于副本交換和局部增強策略的群體構象空間搜索方法.pdf

摘要
申請專利號:

CN201510310103.2

申請日:

2015.06.08

公開號:

CN105046101A

公開日:

2015.11.11

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 19/16申請日:20150608|||公開
IPC分類號: G06F19/16(2011.01)I 主分類號: G06F19/16
申請人: 浙江工業大學
發明人: 張貴軍; 郝小虎; 俞旭鋒; 周曉根; 陳凱; 徐東偉
地址: 310014浙江省杭州市下城區朝暉六區潮王路18號浙江工業大學
優先權:
專利代理機構: 杭州斯可睿專利事務所有限公司33241 代理人: 王利強
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510310103.2

授權公告號:

||||||

法律狀態公告日:

2018.06.01|||2015.12.09|||2015.11.11

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

一種基于副本交換和局部增強策略的群體構象空間搜索方法,在差分進化算法框架下,采用Rosetta Score3粗粒度知識能量模型來有效降低構象空間搜索維數、提高算法的收斂速度;引入基于知識的片段組裝技術可以有效提高預測精度;利用Monte Carlo算法良好的局部搜索性能對種群做局部增強,以得到更為優良的局部構象,結合差分進化算法較強的全局搜索能力,可以對構象空間進行更為有效的采樣,副本交換策略的引入使得群體的多樣性以及空間采樣能力得到進一步增強。

權利要求書

1.一種基于副本交換和局部增強策略的群體構象空間搜索方法,其特征在于:所
述構象空間搜索方法包括以下步驟:
1)給定輸入序列信息;
2)設置系統參數:種群大小popSize,算法的迭代次數T,交叉因子CR,片段的
長度L,副本層數RE,副本層溫度參數kT;
3)種群初始化:在每個副本層,由輸入序列產生popSize個種群個體Pinit;
4)開始迭代,在每個副本層執行種群更新過程,對初始種群中的每個個體:
4.1)設i=1,其中i∈{1,2,3,…,popSize};令Ptarget=Pi,其中i為序號,Ptarget
表示目標個體;
4.2)隨機生成正整數rand1,rand2,rand3,其中rand1∈{1,2,3,......popSize},
rand1≠i,rand2≠rand3∈{1,2,…,Length},Length為序列長度;
4.3)針對個體Pj做變異操作,其中:j=rand1,令a=min(rand2,rand3),b=
max(rand2,rand3),k∈[a,b];
4.4)對蛋白質鏈中第a到b個氨基酸做如下操作:
a:令Ptarget.phi(k)=Pj.phi(k);
b:令Ptarget.psi(k)=Pj.psi(k);
c:令Ptarget.omega(k)=Pj.omega(k);
步驟a,b,c分別為:將Ptargett的氨基酸k所對應的二面角phi、psi、
omega替換為Pj的相同位置所對應的二面角phi、psi、omega;
4.5)通過變異得到測試個體Ptrial;
4.6)生成隨機數rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);
4.7)根據 P trai 1 = P trai 1 , rand 5 = P t arg et , rand 5 if ( rand 4 CR ) P trai 1 , rand 5 otherwise ]]>執行交叉過程:若隨機
數rand4<=CR,個體Ptrial的片段rand5替換為個體Ptargett中對應的片
段,否則直接繼承個體Ptrial。
4.8)根據RosettaScore3計算Ptarget和Ptrial的能量:E(Ptarget)和E(Ptrial);
4.9)若E(Ptarget)>E(Ptrial)則用Ptrial替換Ptarget,否則保持種群不變;
5)得到更新種群Pupdate;
6)對更新種群中的每個個體Pi:
6.1)調用MonteCarlo方法對個體做局部增強;
6.2)計算增強過程中產生的構象的能量E(MC);
6.3)若E(Pi)>E(MC),則更新種群,否則保持種群不變;
7)得到局部增強后的種群Penhance;
8)當所有副本層的種群都完成一次更新,進行副本交換操作:
8.1)在相鄰的兩個副本層中各隨機選擇一個個體Pexchange_A、Pexchange_B,用于
副本交換;
8.2)根據RosettaScore3計算兩個個體Pexchange_A、Pexchange_B的能量E(Pexchange_A)、
E(Pexchange_B);
8.3)根據判決公式 Judge = e ( ( 1 ( kT ) B - 1 ( kT ) A ) × E ( P exchange _ B ) - E ( P exchange _ A ) ) ]]>判斷是否進行副本交
換,其中(kT)A、(kT)B分別是個體Pexchange_A、Pexchange_B對應副本層的能
量參數,Judge為判決數;
8.4)根據判決結果,以一定的概率進行副本交換操作:交換這兩個個體;
9)迭代的運行步驟4)~8),至滿足終止條件。

說明書

一種基于副本交換和局部增強策略的群體構象空間搜索方法

技術領域

本發明涉及生物信息學、計算機應用領域,尤其涉及的是一種基于副本交換和局部增強策略的群體構象空間搜索方法。

背景技術

蛋白質分子在生物細胞化學反應過程中起著至關重要的作用。它們的結構模型和生物活性狀態對我們理解和治愈多種疾病有重要的意義。蛋白質只有折疊成特定的三維結構才能產生其特有的生物學功能。因此,要了解蛋白質的功能,就必須獲得其三維空間結構。

蛋白質三級結構預測是生物信息學的一個重要任務。蛋白質構象優化問題現在面臨最大的挑戰是對極其復雜的蛋白質能量函數曲面進行搜索。蛋白質能量模型考慮了分子體系成鍵作用以及范德華力、靜電、氫鍵、疏水等非成鍵作用,致使其形成的能量曲面極其粗糙,構象對應局部極小解數目隨序列長度的增加呈指數增長。而蛋白質構象預測算法能夠找到蛋白質穩定結構的機理是,大量的蛋白質亞穩定結構構成了低能量區域,所以能否找到蛋白質全局最穩定結構的關鍵是算法能夠找到大量的蛋白質亞穩定結構,即增加算法的種群多樣性。因此,針對更加精確的蛋白質力場模型,選取有效的構象空間優化算法,使新的蛋白質結構預測算法更具有普遍性和高效性成為生物信息學中蛋白質結構預測的焦點問題。

目前,蛋白質結構預測方法大致可以分為兩類,基于模板的方法和不基于模板的方法。其中,不基于模板的從頭預測(Ab-inito)方法應用最為廣泛。它適用于同源性小于25%的大多數蛋白質,僅從序列產生全新結構,對蛋白質分子設計及蛋白質折疊的研究等具有重要意義。當前有以下幾種比較成功的從頭預測方法:張陽與JeffreySkolnick合作的TASSER(Threading/Assembly/Refinement)方法、DavidBaker及團隊設計的Rosetta方法、Shehu等設計的FeLTr方法等。但是到目前還沒有一種十分完善的方法來預測蛋白質的三維結構,即使獲得了很好的預測結果,但也只是針對某些蛋白質而言的,目前主要的技術瓶頸在于兩個方面,第一方面在于采樣方法,現有技術對構象空間采樣能力不強,另一方面在于構象更新方法,現有技術對構象的更新精度仍然不足。

因此,現有的構象空間搜索方法存在不足,需要改進。

發明內容

為了克服現有的蛋白質結構預測方法的構象空間搜索維數較高、收斂速度較慢、預測精度較低的不足,本發明基于差分進化群體算法,提出一種基于副本交換和局部增強策略的群體構象空間搜索方法,RELEDE:在差分進化算法框架下,采用RosettaScore3粗粒度知識能量模型來有效降低構象空間搜索維數、提高算法的收斂速度;引入基于知識的片段組裝技術可以有效提高預測精度;利用MonteCarlo算法良好的局部搜索性能對種群做局部增強,以得到更為優良的局部構象,結合差分進化算法較強的全局搜索能力,可以對構象空間進行更為有效的采樣,副本交換策略的引入使得群體的多樣性以及空間采樣能力得到進一步增強。

本發明解決其技術問題所采用的技術方案是:

一種基于副本交換和局部增強策略的群體構象空間搜索方法,所述搜索方法包括以下步驟:

1)給定輸入序列信息;

2)設置系統參數:種群大小popSize,算法的迭代次數T,交叉因子CR,片段的長度L,副本層數RE,副本層溫度參數kT;

3)種群初始化:在每個副本層,由輸入序列產生popSize個種群個體Pinit;

4)開始迭代,在每個副本層執行種群更新過程,對初始種群中的每個個體:

4.1)設i=1,其中i∈{1,2,3,…,popSize};令Ptarget=Pi,其中i為序號,Ptarget表示目標個體;

4.2)隨機生成正整數rand1,rand2,rand3,其中rand1∈{1,2,3,......popSize},rand1≠i,rand2≠rand3∈{1,2,…,Length},Length為序列長度;

4.3)針對個體Pj做變異操作,其中:j=rand1,令a=min(rand2,rand3),b=max(rand2,rand3),k∈[a,b];

4.4)對蛋白質鏈中第a到b個氨基酸做如下操作:

a:令Ptarget.phi(k)=Pj.phi(k);

b:令Ptarget.psi(k)=Pj.psi(k);

c:令Ptarget.omega(k)=Pj.omega(k);

步驟a,b,c分別為:將Ptarget的氨基酸k所對應的二面角phi、psi、omega替換為Pj的相同位置所對應的二面角phi、psi、omega;

4.5)通過變異得到測試個體Ptrial;

4.6)生成隨機數rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);

4.7)根據 P t r a i l = P t r a i l , r a n d 5 = P t arg e t , r a n d 5 i f ( r a n d 4 C R ) P t r a i l , r a n d 5 o t h e r w i s e ]]>執行交叉過程:若隨機數rand4<=CR,個體Ptrial的片段rand5替換為個體Ptarget中對應的片段,否則直接繼承個體Ptrial。

4.8)根據RosettaScore3計算Ptarget和Ptrial的能量:E(Ptarget)和E(Ptrial);

4.9)若E(Ptarget)>E(Ptrial)則用Ptrial替換Ptarget,否則保持種群不變;

5)得到更新種群Pupdate;

6)對更新種群中的每個個體Pi:

6.1)調用MonteCarlo方法對個體做局部增強;

6.2)計算增強過程中產生的構象的能量E(MC);

6.3)若E(Pi)>E(MC),則更新種群,否則保持種群不變;

7)得到局部增強后的種群Penhance;

8)當所有副本層的種群都完成一次更新,進行副本交換操作:

8.1)在相鄰的兩個副本層中各隨機選擇一個個體Pexchange_A、Pexchange_B,用于副本交換;

8.2)根據RosettaScore3計算兩個個體Pexchange_A、Pexchange_B的能量E(Pexchange_A)、E(Pexchange_B);

8.3)根據判決公式 J u d g e = e ( ( 1 ( k T ) B - 1 ( k T ) A ) × ( E ( P e x c h a n g e _ B ) - E ( P e x c h a n g e _ A ) ) ) ]]>判斷是否進行副本交換,其中(kT)A、(kT)B分別是個體Pexchange_A、Pexchange_B對應副本層的能量參數,Judge為判決數;

8.4)根據判決結果,以一定的概率進行副本交換操作:交換這兩個個體;

9)迭代的運行步驟4)~8),至滿足終止條件。

本發明的有益效果為:在差分進化算法框架下,采用RosettaScore3粗粒度知識能量模型有效降低構象空間搜索維數、提高算法收斂速度;引入基于知識的片段組裝技術可以有效提高預測精度;利用MonteCarlo算法良好的局部搜索性能對種群做局部增強,以得到更為優良的局部構象;結合差分進化算法較強的全局搜索能力,可以對構象空間進行更為有效的采樣,副本交換策略的引入使得群體的多樣性以及空間采樣能力得到進一步增強,從而在構象空間中搜索得到較高精度的近天然態構象。

附圖說明

圖1是蛋白質1ENH構象系綜中構象更新示意圖。

具體實施方式

下面結合附圖對本發明作進一步描述。

參照圖1,一種基于副本交換和局部增強策略的群體構象空間搜索方法,包括以下步驟:

1)給定輸入序列信息;

2)設置系統參數:種群大小popSize,算法的迭代次數T,交叉因子CR,片段的長度L,副本層數RE,副本層溫度參數kT;

3)種群初始化:在每個副本層,由輸入序列產生popSize個種群個體Pinit;

4)開始迭代,在每個副本層執行種群更新過程,對初始種群中的每個個體:

4.1)設i=1,其中i∈{1,2,3,…,popSize};令Ptarget=Pi,其中i為序號,Ptarget表示目標個體;

4.2)隨機生成正整數rand1,rand2,rand3,其中rand1∈{1,2,3,......popSize},rand1≠i,rand2≠rand3∈{1,2,…,Length},Length為序列長度;

4.3)針對個體Pj做變異操作,其中:j=rand1;令a=min(rand2,rand3),b=max(rand2,rand3),k∈[a,b];

4.4)對蛋白質鏈中第a到b個氨基酸做如下操作:

a:令Ptarget.phi(k)=Pj.phi(k);

b:令Ptarget.psi(k)=Pj.psi(k);

c:令Ptarget.omega(k)=Pj.omega(k);

步驟a,b,c分別為:將Ptarget的氨基酸k所對應的二面角phi、psi、omega替換為Pj的相同位置所對應的二面角phi、psi、omega;

4.5)通過變異得到測試個體Ptrial;

4.6)生成隨機數rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);

4.7)根據 P t r a i l = P t r a i l , r a n d 5 = P t arg e t , r a n d 5 i f ( r a n d 4 C R ) P t r a i l , r a n d 5 o t h e r w i s e ]]>執行交叉過程:若隨機數rand4<=CR,個體Ptrial的片段rand5替換為個體Ptarget中對應的片段,否則直接繼承個體Ptrial。

4.8)根據RosettaScore3計算Ptarget和Ptrial的能量:E(Ptarget)和E(Ptrial);

4.9)若E(Ptarget)>E(Ptrial)則用Ptrial替換Ptarget,否則保持種群不變;

5)得到更新種群Pupdate;

6)對更新種群中的每個個體Pi:

6.1)調用MonteCarlo方法對個體做局部增強;

6.2)計算增強過程中產生的構象的能量E(MC);

6.3)若E(Pi)>E(MC),則更新種群,否則保持種群不變;

7)得到局部增強后的種群Penhance;

8)當所有副本層的種群都完成一次更新,進行副本交換操作:

8.1)在相鄰的兩個副本層中各隨機選擇一個個體Pexchange_A、Pexchange_B,用于副本交換;

8.2)根據RosettaScore3計算兩個個體Pexchange_A、Pexchange_B的能量E(Pexchange_A)、E(Pexchange_B);

8.3)根據判決公式 J u d g e = e ( ( 1 ( k T ) B - 1 ( k T ) A ) × ( E ( P e x c h a n g e _ B ) - E ( P e x c h a n g e _ A ) ) ) ]]>判斷是否進行副本交換,其中(kT)A、(kT)B分別是個體Pexchange_A、Pexchange_B對應副本層的能量參數,Judge為判決數;

8.4)根據判決結果,以一定的概率進行副本交換操作:交換這兩個個體;

9)迭代的運行步驟4)~8),至終止條件。

本實施例以序列長度為54的蛋白質1ENH為實施例,一種基于副本交換和局部增強策略的群體構象空間搜索方法,其中包含以下步驟:

1)給定輸入序列信息1ENH;

2)設置系統參數:種群大小popSize=30,算法的迭代次數T=10000,交叉因子CR=0.5,片段的長度L=3,副本層數RE=8,副本層溫度參數kT=[0.67,0.72,0.95,1.14,1.36,1.63,1.95,2.33];

3)種群初始化:在每個副本層,由輸入序列產生30個種群個體Pinit;

4)開始迭代,在每個副本層執行種群更新過程,對初始種群中的每個個體:

4.1)設i=1,其中i∈{1,2,3,…,30};令Ptarget=Pi,其中i為序號,Ptarget表示目標個體;

4.2)隨機生成正整數rand1,rand2,rand3,其中rand1∈{1,2,3,...,30},rand1≠i,rand2≠rand3,∈{1,2,…,54};

4.3)針對個體Pj做變異操作,其中:j=rand1;令a=min(rand2,rand3),b=max(rand2,rand3),k∈[a,b];

4.4)對蛋白質鏈中第a到b個氨基酸做如下操作:

a:令Ptarget.phi(k)=Pj.phi(k);

b:令Ptarget.psi(k)=Pj.psi(k);

c:令Ptarget.omega(k)=Pj.omega(k);

步驟a,b,c分別為:將Ptarget的氨基酸k所對應的二面角phi、psi、omega替換為Pj的相同位置所對應的二面角phi、psi、omega;

4.5)通過變異得到測試個體Ptrial;

4.6)生成隨機數rand4,rand5,其中rand4∈(0,1),rand5∈(1,54);

4.7)根據 P t r a i l = P t r a i l , r a n d 5 = P t arg e t , r a n d 5 i f ( r a n d 4 0.5 ) P t r a i l , r a n d 5 o t h e r w i s e ]]>執行交叉過程:若隨機數rand4<=0.5,個體Ptrial的片段rand5替換為個體Ptarget中對應的片段,否則直接繼承個體Ptrial。

4.8)根據RosettaScore3計算Ptarget和Ptrial的能量:E(Ptarget)和E(Ptrial);

4.9)若E(Ptarget)>E(Ptrial)則用Ptrial替換Ptarget,否則保持種群不變;

5)得到更新種群Pupdate;

6)對更新種群中的每個個體Pi:

6.1)調用MonteCarlo方法對個體做局部增強;

6.2)計算增強過程中產生的構象的能量E(MC);

6.3)若E(Pi)>E(MC),則更新種群,否則保持種群不變;

7)得到局部增強后的種群Penhance;

8)當所有副本層的種群都完成一次更新,進行副本交換操作:

8.1)在相鄰的兩個副本層中各隨機選擇一個個體Pexchange_A、Pexchange_B,用于副本交換;

8.2)根據RosettaScore3計算兩個個體Pexchange_A、Pexchange_B的能量E(Pexchange_A)、E(Pexchange_B);

8.3)根據判決公式 J u d g e = e ( ( 1 ( k T ) B - 1 ( k T ) A ) × ( E ( P e x c h a n g e _ B ) - E ( P e x c h a n g e _ A ) ) ) ]]>判斷是否進行副本交換,其中(kT)A、(kT)B分別是個體Pexchange_A、Pexchange_B對應副本層的能量參數,Judge為判決數;

8.4)根據判決結果,以一定的概率進行副本交換操作:交換這兩個個體;

9)迭代的運行步驟4)~8),至終止條件。

以序列長度為54的蛋白質1ENH為實施例,運用以上方法得到了該蛋白質的近天然態構象,構象系綜中構象更新圖如圖1所示。

以上闡述的是本發明給出的一個實施例表現出來的優良效果,顯然本發明不僅適合上述實施例,在不偏離本發明基本精神及不超出本發明實質內容所涉及內容的前提下可對其做種種變化加以實施。

關 鍵 詞:
一種 基于 副本 交換 局部 增強 策略 群體 構象 空間 搜索 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種基于副本交換和局部增強策略的群體構象空間搜索方法.pdf
鏈接地址:http://www.wwszu.club/p-6401487.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大