鬼佬大哥大
  • / 16
  • 下載費用:30 金幣  

一種拉丁超立方采樣的擴展方法.pdf

摘要
申請專利號:

CN201510465488.X

申請日:

2015.07.31

公開號:

CN105068972A

公開日:

2015.11.18

當前法律狀態:

駁回

有效性:

無權

法律詳情: 發明專利申請公布后的駁回IPC(主分類):G06F 17/16申請公布日:20151118|||實質審查的生效IPC(主分類):G06F 17/16申請日:20150731|||公開
IPC分類號: G06F17/16 主分類號: G06F17/16
申請人: 哈爾濱工業大學
發明人: 李偉; 楊明; 劉志釗; 馬萍; 鄭瀟
地址: 150080黑龍江省哈爾濱市南崗區西大直街92號
優先權:
專利代理機構: 北京科龍寰宇知識產權代理有限責任公司11139 代理人: 孫皓晨; 陳士騫
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510465488.X

授權公告號:

||||||

法律狀態公告日:

2018.12.21|||2015.12.16|||2015.11.18

法律狀態類型:

發明專利申請公布后的駁回|||實質審查的生效|||公開

摘要

本發明公開了一種拉丁超立方采樣的擴展方法。假設已有樣本大小為n的LHS,擴展方法的目的是得到樣本大小為n+m的LHS新采樣,同時新采樣中最多地包含已有采樣點。本發明的方法通過將LHS采樣點之間的關系轉化為簡單無向無環圖,得到鄰接矩陣,再求解最大獨立集來最多地保留已有采樣點。實現步驟包括計算已有采樣點在新采樣結構中的分布,計算需要保留的采樣點矩陣,計算新增采樣點矩陣,最后計算擴展后的拉丁超立方采樣矩陣。本發明能夠盡量少的刪除已有采樣點,節約采樣成本;同時生成新采樣點,使得新采樣點和保留的采樣點所構成的采樣樣本,仍滿足LHS結構。

權利要求書

1.一種拉丁超立方采樣的擴展方法,其特征在于,包括以下步驟:
步驟1:計算已有采樣點在新采樣結構中的分布,包括計算原始排序矩
陣映射到新采樣結構中的排序矩陣原始隨機數矩陣映射到新采
樣結構中的隨機數矩陣其中排序矩陣的矩陣元素
其中i=1,2,…,n,j=1,2,…,r,為向下取整;隨機數矩陣
的矩陣元素其中i=1,2,…,n,j=1,2,…,r,n為已有
樣本大小,n+m為擴展得到的樣本大小,n、m、r均為自然數;
步驟2:計算需要保留的采樣點矩陣首先根據構建采樣點間的
鄰接矩陣An×n,將采樣點間的關系用矩陣中的元素表示;然后對采樣點1,2,…,n
的每個組合進行全排列,全排列矩陣為B=[B1B2…Bq]T;取p=1,根據BP中
排列組合的序號剔除對應采樣點,即An×n中對應的行和列,得到新的鄰接矩陣
A',如果A'不為零陣,則p=p+1,重新刪除采樣點構建;如果A'為零矩陣,
記B'p為BP中非零元素構成的向量,則B'p中的元素就是剔除采樣的序號,A'的
維數記為n',即保留n'個采樣點;最后按照向量B'p元素的值剔除
和中對應的行,分別得到和其中鄰接矩陣An×n的矩
陣元素為

步驟3:計算新增采樣點矩陣首先生成(n+m)×r維的新排序矩
陣L'(n+m)×r,將L'(n+m)×r的每一列與相應列中相同的元素刪除,將剩余元素構
成的矩陣記為然后生成隨機數矩陣由此計算累積概率值矩
陣最后求得新增采樣值矩陣
步驟4:計算ELHS采樣矩陣根據步驟1、2、3得到新的采樣值
矩陣即為樣本大小為(n+m)的LHS,其中采樣值矩陣
X ( n + m ) × r ( n e w ) = X n × r ( 2 ) X ( n + m - n ) × r ( 3 ) , ]]>其中分別由步驟2、步驟3求得。
2.根據權利要求1所述的拉丁超立方采樣的擴展方法,其特征在于,步
驟2中所述的全排列矩陣為B=[B1B2…Bq]T,其中B的每一行都是1,2,…,n的一
個排列,不足n個元素的最后用0補齊,且Bi中0元素的個數不少于Bj,
1≤i≤j≤n。
3.根據權利要求1或2所述的拉丁超立方采樣的擴展方法,其特征在于,
步驟3中所述的新排序矩陣L'(n+m)×r的每一列都是隨機生成的整數1到n+m的
一個排列,隨機數矩陣的矩陣元素ri,j為[01]上均勻分布的隨機數,累
積概率值矩陣的矩陣元素的計算公式為
u i , j ( 2 ) = l i , j ( 2 ) - 1 + r i , j ( 2 ) ( n + m ) . ]]>
4.根據權利要求1或3所述的拉丁超立方采樣的擴展方法,其特征在于,
步驟3中所述的新增采樣點矩陣的計算公式為xi=Fi-1(Probi)。

說明書

一種拉丁超立方采樣的擴展方法

技術領域

本發明涉及數據信息處理領域,具體而言,涉及一種拉丁超立方采樣的
擴展方法。

背景技術

拉丁超立方采樣(LatinHypercubeSampling,LHS)是一種全空間填充
且非重疊的隨機采樣方法。全空間填充采樣確保即使在沒有詳細的源函數特
性的情況下,也可以得到該函數在整個設計空間的信息;非重疊采樣則確保
沒有重復和多余的采樣點。LHS也是一種隨機采樣方法,但是與隨機采樣不
同的是,它產生的采樣點在全局內是均勻的。傳統拉丁超立方采樣算法基于
固定采樣數,在應用中需要根據預先給定的采樣數構造固定的采樣結構和采
樣點,然后計算得到結果樣本;若計算結果不理想則需要增加采樣數,必須
根據增加后的采樣數重新構造新的采樣結構并計算新的結果樣本,無法利用
原有的結果樣本,降低了再次采樣的效率。因此在已有采樣結構的基礎上擴
展采樣數,充分利用原有的計算結果樣本是十分重要的。

拉丁超立方采樣擴展(ExtensionofLatinHypercubeSampling,ELHS)問
題是:已有樣本大小為n的LHS,希望得到樣本大小為n+m且滿足LHS結構
的采樣樣本。ELHS的目的是新的采樣點中最大限度地利用已有采樣點,這
樣可以在保證采樣結構的基礎上減少重新采樣的時間和成本。

傳統的拉丁超立方采樣擴展方法首先構造樣本大小n+m的LHS結構,并
判斷已有采樣點在該結構中的位置,然后根據空白層的位置和個數產生新的
采樣,進而構成新采樣。傳統擴展方法中,新采樣并不能保證是LHS,這是
因為樣本大小的變化導致LHS采樣空間結構的變化,已有采樣點可能不滿足
LHS結構,如圖2所示,已有采樣點在新的結構中有部分點落在同一區間內,
不再是嚴格意義上的拉丁超立方采樣。

發明內容

本發明提供一種拉丁超立方采樣的擴展方法,針對LHS的擴展問題,在
不破壞拉丁超立方采樣結構的基礎上最大限度地利用已有采樣點,減少了重
新采樣的時間和成本。

為達到上述目的,本發明提供了一種拉丁超立方采樣的擴展方法,包括
以下步驟:

步驟1:計算已有采樣點在新采樣結構中的分布,包括計算原始排序矩
陣映射到新采樣結構中的排序矩陣原始隨機數矩陣映射到新采
樣結構中的隨機數矩陣其中排序矩陣的矩陣元素
其中i=1,2,…,n,j=1,2,…,r,為向下取整;隨機數矩陣
的矩陣元素其中i=1,2,…,n,j=1,2,…,r,n、r均
為自然數;

步驟2:計算需要保留的采樣點矩陣首先根據構建采樣點間的
鄰接矩陣An×n,將采樣點間的關系用矩陣中的元素表示;然后對采樣點1,2,…,n
的每個組合進行全排列,全排列矩陣為B=[B1B2…Bq]T;取p=1,根據BP中
排列組合的序號剔除對應采樣點,即An×n中對應的行和列,得到新的鄰接矩陣
A',如果A'不為零陣,則p=p+1,重新刪除采樣點構建;如果A'為零矩陣,
記B'p為BP中非零元素構成的向量,則B'p中的元素就是剔除采樣的序號,A'的
維數記為n',即保留n'個采樣點;最后按照向量B'p元素的值剔除
和中對應的行,分別得到和其中鄰接矩陣An×n的矩
陣元素為


步驟3:計算新增采樣點矩陣首先生成(n+m)×r維的新排序矩
陣L'(n+m)×r,將L'(n+m)×r的每一列與相應列中相同的元素刪除,將剩余元素構
成的矩陣記為然后生成隨機數矩陣由此計算累積概率值矩
陣最后求得新增采樣值矩陣

步驟4:計算ELHS采樣矩陣根據步驟1、2、3得到新的采樣值
矩陣即為樣本大小為(n+m)的LHS,其中采樣值矩陣
X ( n + m ) × r ( n e w ) = X n × r ( 2 ) X ( n + m - n ) × r ( 3 ) , ]]>其中分別由步驟2、步驟3求得。

進一步地,步驟2中所述的全排列矩陣為B=[B1B2…Bq]T,其中B的每一
行都是1,2,…,n的一個排列,不足n個元素的最后用0補齊,且Bi中0元素的
個數不少于Bj,1≤i≤j≤n。

進一步地,步驟3中所述的新排序矩陣L'(n+m)×r的每一列都是隨機生成的整
數1到n+m的一個排列,隨機數矩陣的矩陣元素ri,j為[01]上均勻分布
的隨機數,累積概率值矩陣的矩陣元素的計算公式為

u i , j ( 2 ) = l i , j ( 2 ) - 1 + r i , j ( 2 ) ( n + m ) . ]]>

進一步地,步驟3中所述的新增采樣點矩陣的計算公式為

x i = F i - 1 ( Prob i ) . ]]>

本發明提供的生成新采樣點的方案使得新生成的采樣點和保留的已有采
樣點仍能構成一個LHS;針對LHS的擴展問題,本發明在不破壞拉丁超立方
采樣結構的基礎上最大限度地利用已有采樣點,減少了重新采樣的時間和成
本;本發明對已有采樣點和新采樣點的個數沒有要求,普遍適用于一般增量
擴展、整數倍擴展等場合。

附圖說明

為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實
施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面
描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,
在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。

圖1為變量維數為2,樣本大小為5的拉丁超立方采樣的示意圖;

圖2為拉丁超立方擴展導致的已有采樣點在新采樣結構中的分布的示意
圖;

圖3為本發明將最大保留問題轉化為圖論中最大獨立集問題所構造的簡
單無向無環圖的示意圖;

圖4為本發明方法的算法流程示意圖;

圖5為依照本發明實施例的采用傳統拉丁超立方采樣擴展方法結果的示
意圖;

圖6為依照本發明實施例的采用本發明方法擴展結果的示意圖。

具體實施方式

下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行
清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而
不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有付
出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。

本發明的拉丁超立方采樣的擴展方法將已有采樣的最大保留問題轉化為
圖論問題,將采樣點映射為圖中的頂點,采樣點序號對應頂點序號,如果兩
個采樣點中至少存在某個維度的變量落在同一區間內,則在圖中將對應的兩
個頂點連接,即圖中的一條邊,構成一個簡單無環圖,如圖3所示。這樣已
有采樣點的最大保留問題就轉化為圖論中最少刪除頂點使得圖中邊的數量為
零,即圖論中的最大獨立集問題。本發明方法的數學描述及實現所采取的技
術方案如下:

假設已有樣本大小為n的拉丁超立方采樣,樣本矩陣為排序
矩陣為累積概率值矩陣為隨機數矩陣為需要刪除n-n′個
已有采樣點,并生成n-n′+m個新采樣點使得

X ( n + m ) × r ( n e w ) = X n × r ( o l d ) X ( n + m - n ) × r ( 2 ) ]]>

構成一個樣本大小為n+m的LHS。具體包括以下步驟:

步驟1:計算已有采樣點在新采樣點結構中的分布。

計算映射到新采樣結構中的排序矩陣矩陣元素
其中i=1,2,…,n,j=1,2,…,r,為向下取整;

計算映射到新采樣結構中的隨機數矩陣矩陣元素
r i , j ( 1 ) = u i , j ( o l d ) · ( n + m ) - ( l i , j ( 1 ) - 1 ) , ]]>其中i=1,2,…,n,j=1,2,…,r。

步驟2:計算需要保留的采樣點矩陣

根據構建采樣點間的鄰接矩陣An×n,將采樣點間的關系用矩陣中的元
素表示為


對1,2,…,n的每個組合進行全排列,全排列矩陣為B=[B1B2…Bq]T,其中B
的每一行都是1,2,…,n的一個排列,不足n個元素的最后用0補齊,且Bi中0
元素的個數不少于Bj,1≤i≤j≤n;取p=1,根據Bp中排列組合的序號剔除對
應采樣點,即An×n中對應的行和列,得到新的鄰接矩陣A';如果A'不為零陣,
則p=p+1,重新刪除采樣點構建;如果A'為零矩陣,記B'p為Bp中非零元素構
成的向量,B'p中的元素就是剔除采樣的序號,A'的維數記為n',即保留n'個
采樣點;

按照向量B'p元素的值剔除和中對應的行,分別得到

步驟3:計算新增采樣點矩陣

生成(n+m)×r維的新排序矩陣L'(n+m)×r,其中L'(n+m)×r的每一列都是隨機生成
的整數1到n+m的一個排列;

將L'(n+m)×r每一列與相應列中相同的元素刪除,剩余元素構成的矩陣記

生成隨機數矩陣矩陣元素ri,j為[01]上均勻分布的隨機數;

計算累積概率值矩陣矩陣元素

由公式求得采樣值矩陣

步驟4:計算ELHS采樣矩陣根據步驟1、2得到新排序矩陣
新隨機數矩陣新采樣的累積概率值矩陣和新的采樣值矩陣

L ( n + m ) × r ( n e w ) = L n × r ( 2 ) L ( n + m - n ) × r ( 3 ) R ( n + m ) × r ( n e w ) = R n × r ( 2 ) R ( n + m - n ) × r ( 3 ) U ( n + m ) × r ( n e w ) = U n × r ( 2 ) U ( n + m - n ) × r ( 3 ) X ( n + m ) × r ( n e w ) = X n × r ( 2 ) X ( n + m - n ) × r ( 3 ) ]]>

由此得到的即為樣本大小為(n+m)的LHS。

為評估本發明方法的性能及應用,驗證方法的有效性,并使本發明的目
的、技術方案和有益效果更加清楚明白,下面結合具體實施例,并參照附圖,
對本發明進一步詳細說明。

原始的拉丁超立方采樣以附圖1為例,即采樣點維數為2,其中x1服從
[0,10]上的均勻分布,x2是低限為5,眾數為7.5,上限為10的三角分布,采
樣點個數為5。LHS的基本步驟為首先在每個維度的取值范圍內等概率地分
成5個相鄰且不重疊的區間,每個維度等概率地隨機選擇一個區間,得到每
個維度的分布函數F(·)為

F1(x1)=0.1×x1,0≤x1≤10

F 2 ( x 2 ) = ( x 2 - 5 ) 2 12.5 5 x 2 7.5 1 - ( 10 - x 2 ) 2 12.5 7.5 < x 2 10 ]]>

然后根據每個維度的分布函數F(·)的反函數求得采樣值求得

x1=10×F1(x1), x 2 = 5 + 12.5 × F 2 ( x 2 ) 0 F 2 ( x 2 ) 0.5 10 - 12.5 × ( 1 - F 2 ( x 2 ) ) 0.5 < F 2 ( x 2 ) 1 ]]>

從而得到一組采樣X=[x1x2x3x4x5],其采樣矩陣和相關矩陣為

X 5 × 2 ( o l d ) = 1.29 6.12 3.57 8.46 5.86 7.60 6.57 8.30 9.00 6.90 , L 5 × 2 ( o l d ) = 1 1 2 5 3 3 4 4 5 2 , R 5 × 2 ( o l d ) = 0.645 0.500 0.785 0.070 0.930 0.710 0.285 0.860 0.500 0.430 , U 5 × 2 ( o l d ) = 0.129 0.100 0.357 0.814 0.586 0.542 0.657 0.772 0.900 0.286 ]]>

首先,用傳統方法獲得采樣樣本大小為7的擴展拉丁超立方采樣。如圖
2,已有采樣在新采樣結構中的分布可知,豎列中有三列沒有采樣點,序號為
2、4、6,橫列中有三列沒有采樣點,序號為2、5、7,因此生成一個樣本大
小為3的LHS,采樣矩陣為

X 3 × 2 ( 1 ) = 2.279 2.547 0.958 1.965 1.158 0.971 ]]>

然后,將新生成的3個采樣點映射到圖2中,得到新采樣點在新采樣結
構中的位置,累積概率值矩陣為

U 3 × 2 ( 1 ) = 0.817 0.922 0.149 0.576 0.549 0.147 ]]>

進而,根據分布函數的反函數得到新采樣點數值,如圖5所示,新的采
樣矩陣為

X ( 8 × 2 ) ( n e w ) = 1.29 6.12 3.57 8.46 5.86 7.60 6.57 8.30 9.00 6.90 8.17 9.01 1.49 7.70 5.49 6.36 ]]>

從圖5可知,傳統LHS擴展方法產生的新采樣有8個點,不是嚴格意義
上的采樣大小為7的LHS。

下面采用本發明方法獲得樣本大小為7的擴展拉丁超立方采樣,具體示
意圖如圖1所示。

步驟1:計算已有采樣點在新采樣點結構中的分布。

計算映射到新采樣結構中的排序矩陣

L 5 × 2 ( 1 ) = 1 1 3 6 5 4 5 6 7 3 ]]>

b.計算映射到新采樣結構中的隨機數矩陣

R ( 5 × 2 ) ( 1 ) = 0.903 0.700 0.499 0.698 0.102 0.794 0.599 0.404 0.300 0.002 ]]>

步驟2:計算需要保留的采樣點矩陣

根據構建采樣點間的鄰接矩陣A5×5,將采樣點間的關系用矩陣中的元
素表示;

A 5 × 5 = 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 1 1 0 0 0 0 0 0 0 ]]>

從1到5的所有整數構成排列組合矩陣記為Bp,Bp的每一行是一個排列
組合,則

B p = 0 0 0 0 0 1 0 0 0 0 2 0 0 0 0 · · · · · · · · · · · · · · · 1 2 3 4 5 120 × 5 ; ]]>

根據BP中排列組合的序號剔除對應采樣點,即鄰接矩陣A5×5中對應的行和
列,得到新的鄰接矩陣A';當第五次時,剔除第四個點之后得到鄰接矩陣
為零矩陣。則非零元素構成的向量B'p=[1235],B'p中的元素就是剔除
采樣的序號。A'的維數n'=4,即保留n'個采樣點;

c.按照向量B'p元素的值剔除和中對應的行,分別得

L 4 × 2 ( 2 ) = 1 1 3 6 5 4 7 3 R 4 × 2 ( 2 ) = 0.903 0.700 0.499 0.698 0.102 0.794 0.300 0.002 U 4 × 2 ( 2 ) = 0.129 0.100 0.357 0.814 0.586 0.542 0.900 0.286 X 4 × 2 ( 2 ) = 1.29 6.12 3.57 8.46 5.86 7.60 9.00 6.90 ; ]]>

步驟3:計算新增采樣點矩陣即

生成(n+m)×r維的新排序矩陣L'7×2,其中L'7×2的每一列都是隨機生成的整
數1到7的一個排列, L 7 × 2 = 6 3 7 5 1 2 4 4 7 1 6 2 3 5 T ; ]]>

將L'7×2每一列中與相應列相同的元素刪除,剩余元素構成的矩陣記為

L 3 × 2 ( 3 ) = 6 7 2 2 4 5 ; ]]>

生成隨機數矩陣

R 3 × 2 ( 3 ) = 0.800 0.916 0.649 0.734 0.743 0.392 ; ]]>

計算累積概率值矩陣

U 3 × 2 ( 3 ) = L 3 × 2 ( 3 ) - 1 + R 3 × 2 ( 3 ) 7 = 0.829 0.988 0.240 0.248 0.535 0.628 ; ]]>

由公式求得采樣值矩陣

X 3 × 2 ( 3 ) = 8.29 9.61 2.40 6.76 5.35 7.84 . ]]>

步驟4:計算ELHS采樣矩陣

X 7 × 2 ( n e w ) = X 4 × 2 ( 2 ) X 3 × 2 ( 3 ) = 1.29 3.57 5.86 9.00 8.29 2.40 5.35 6.12 8.46 7.60 6.90 9.61 6.76 7.84 T , ]]>

得到采樣點為7的擴展拉丁超立方采樣,采樣結果見附圖6。

本發明提出的擴展LHS方法可以應用于多種領域,例如電力系統概率潮
流計算、混凝土抗壓強度預測模型建立和航空器性能的靈敏度分析等。

最后應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其
限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術
人員應當理解:其依然可以對前述實施例所記載的技術方案進行修改,或者
對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術
方案的本質脫離本發明實施例技術方案的精神和范圍。

關 鍵 詞:
一種 拉丁 立方 采樣 擴展 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:一種拉丁超立方采樣的擴展方法.pdf
鏈接地址:http://www.wwszu.club/p-6386016.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大