鬼佬大哥大
  • / 15
  • 下載費用:30 金幣  

定量樣本中源自細胞凋亡的DNA濃度的方法及其應用.pdf

關 鍵 詞:
定量 樣本 源自 細胞 DNA 濃度 方法 及其 應用
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201510308841.3

申請日:

2015.06.05

公開號:

CN104894268A

公開日:

2015.09.09

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):C12Q 1/68申請日:20150605|||公開
IPC分類號: C12Q1/68; G06F19/22(2011.01)I; G06F19/24(2011.01)I 主分類號: C12Q1/68
申請人: 上海美吉生物醫藥科技有限公司
發明人: 曾豐波; 楊功達; 韓繼臣
地址: 201314上海市浦東新區康新公路3399弄3號
優先權:
專利代理機構: 上海晨皓知識產權代理事務所(普通合伙)31260 代理人: 成麗杰
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201510308841.3

授權公告號:

||||||

法律狀態公告日:

2018.02.09|||2015.10.07|||2015.09.09

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明屬于分子生物學技術領域,公開了一種定量樣本中源自細胞凋亡的DNA濃度的方法,該方法對正常人的血漿游離DNA和機械打斷的組織DNA測序后,統計在血漿游離DNA測序序列和組織DNA測序序列中含量存在顯著差異的差異序列集合,并通過計算得出來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值、來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值,最后結合待檢樣本的差異序列對應片段百分比總量的實際值,計算得到待檢樣本中源自細胞凋亡的DNA的濃度。此外,本發明計算得到的待檢樣本中源自細胞凋亡的DNA的濃度值,還可用于對游離DNA樣本的質控以及對組織壞死的檢測。

權利要求書

權利要求書
1.  一種定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,包含下述步驟:
(1)取健康人的血漿游離DNA樣本和機械打斷的組織DNA樣本,分別測序,將測序獲得的序列比對到人類參考基因組上,統計差異序列集合,所述差異序列集合中包含若干差異序列;
所述差異序列為:比對到人類參考基因組上的測序序列5’端k個堿基的序列;且游離DNA樣本的測序序列中5’端為該種差異序列的序列含量比例,與組織DNA樣本的測序序列中5’端為同種差異序列的序列含量比例存在顯著差異;其中,k為自然數;
(2)計算游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
計算組織DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
(3)對待檢樣本進行測序,將測序獲得的序列比對到人類參考基因組上,計算所有5’端為差異序列的序列百分比總和,作為待檢樣本的差異序列對應片段百分比總量的實際值;
(4)根據上述來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值、來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值以及待檢樣本的差異序列對應片段百分比總量的實際值,計算得到待檢樣本中源自細胞凋亡的DNA的濃度。

2.  根據權利要求1所述的定量樣本中源自細胞凋亡的DNA濃度的方法, 其特征在于,步驟(4)中所述的根據來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值、來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值以及待檢樣本的差異序列對應片段百分比總量的實際值,計算得到待檢樣本中源自細胞凋亡的DNA的濃度的計算式為:
p×PScf+(1-p)×PSg=PSt]]>
其中:
p為要計算的待檢樣本中源自細胞凋亡的DNA的濃度;
為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
為待檢樣本的差異序列對應片段百分比總量的實際值。

3.  根據權利要求1所述的定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,獲取步驟(1)中所述的血漿游離DNA樣本和機械打斷的組織DNA樣本的方法為:抽取健康人的血液,進行第一次離心,得到上清液和沉淀,取沉淀,再進行機械打斷,即為機械打斷的白細胞樣本,作為機械打斷的組織DNA樣本;對第一次離心得到的上清液進行第二次離心,去掉沉淀,取上清液,即為血漿游離DNA樣本。

4.  根據權利要求1所述的定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,步驟(1)中所述的統計差異序列集合的方法為:
記比對到人類參考基因組上的測序序列5’端k個堿基的序列為Kmer,k為自然數;記差異序列集合為S;記游離DNA樣本組為Gcf組,記組織DNA樣本組為Gg組:
(1)根據Kmer的不同分別對Gcf組和Gg組的測序序列進行分組,統計每組序列的比例:
PKmerj=NKmerjΣNKmerj]]>
其中:
表示樣本j的測序序列中,5’端以Kmer開始的序列在所有測序序列中的比例、
表示樣本j的測序序列中,5’端以Kmer開始的序列的條數、
表示樣本j的所有測序序列的條數;
(2)統計在Gcf和Gg組中具有顯著差異的Kmer:
分別計算和
PKmercf=ΣcfPKmerjΣcfj]]>
PKmerg=ΣgPKmerjΣgj]]>
其中:
依次表示在Gcf組和Gg組中5’端為特定Kmer的序列在每個樣本的測序序列中的含量比例的平均值、
依次表示在Gcf組和Gg組中5’端為特定Kmer的序列在每個樣本的測序序列中的含量比例的總和、
Σcfj、Σgj依次表示Gcf組和Gg組中樣本的個數;
比較上述和選取的所有Kmer作為集合S,其中,N>1。

5.  根據權利要求4所述的定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,K為1~10之間的自然數;1<N≤10。

6.  根據權利要求4所述的定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,步驟(2)中所述的計算游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值的公式為:
PScf=ΣKmer∈SPKmercf]]>
其中:
為要計算的來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
表示血漿游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和。

7.  根據權利要求4所述的用于定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,步驟(2)中所述計算組織DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值的公式為:
PSg=ΣKmer∈SPKmerg]]>
其中:
為要計算的來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
表示組織DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和。

8.  根據權利要求4所述的用于定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,步驟(3)中計算待檢樣本比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為待檢樣本的差異 序列對應片段百分比總量的實際值的公式為:
Pst=ΣKmer∈SPKmert]]>
其中:
為要計算的待檢樣本的差異序列對應片段百分比總量的實際值;
差異序列集合記為S;表示待檢樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和。

9.  權利要求1至8中的任一項所述的方法的應用,其特征在于,根據計算得到的待檢樣本中源自細胞凋亡的DNA的濃度值,對游離DNA樣本進行質控。

10.  權利要求1至8中的任一項所述的方法的應用,其特征在于,根據計算得到的待檢樣本中源自細胞凋亡的DNA的濃度值,檢測組織壞死。

說明書

說明書定量樣本中源自細胞凋亡的DNA濃度的方法及其應用
技術領域
本發明涉及分子生物學技術領域,特別涉及一種用于定量樣本中源自細胞凋亡的DNA濃度的方法及其應用。
背景技術
血漿中存在游離DNA(或稱循環DNA,也簡稱cfDNA),游離DNA來自凋亡細胞,是一種無細胞狀態的、片段化的胞外DNA,存在于血液、滑膜液和腦脊液等體液中。cfDNA在正常人的血液中含量甚微,平均值為13ng/ml,而當機體在一些特殊狀態時(如患有腫瘤、自身免疫性疾病、感染性疾病、中風、心肌梗死及妊娠等),其含量明顯上升,比如惡性腫瘤患者平均值達到180ng/ml。因此,游離DNA在疾病的早期診斷、預后和監測等方面具有重要潛在價值。
一直以來,由于缺乏高靈敏性和高特異性的實驗方法,導致有關游離DNA與疾病相關性的研究在較長時期內進展緩慢。直到有效分離游離DNA技術的出現,使這一領域的研究在最近二十多年得到了較迅速發展。但是,游離DNA含量少,而且高度片段化,提取cfDNA往往成為后續實驗成敗的關鍵。
組織內DNA片段(gDNA)為機械或其他理化形式打斷,其與游離DNA在序列組成上會有差別,cfDNA在提取過程中可能混入gDNA序列片段,大量混入對后續分析造成影響。
發明內容
本發明的目的在于提供一種定量樣本中源自細胞凋亡的DNA濃度的方法,該方法通過DNA片段的堿基組成信息來對樣本中源自細胞凋亡的DNA濃度進行定量。
本發明的另一目的在于提供上述定量樣本中源自細胞凋亡的DNA濃度的方法的應用。
為解決上述技術問題,本發明的實施方式所提供的定量樣本中源自細胞凋亡的DNA濃度的方法,包含下述步驟:
(1)取健康人的血漿游離DNA樣本和機械打斷的組織DNA樣本,分別測序,將測序獲得的序列比對到人類參考基因組上,統計差異序列集合,所述差異序列集合中包含若干差異序列;
所述差異序列為:比對到人類參考基因組上的測序序列5’端k個堿基的序列,且游離DNA樣本的測序片段中5’端為該種差異序列的序列含量比例,與組織DNA樣本的測序序列中5’端為同種差異序列的序列含量比例存在顯著差異;其中,k為自然數;
(2)計算游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
計算組織DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
(3)對待檢樣本進行測序,將測序獲得的序列比對到人類參考基因組上,計算所有5’端為差異序列的序列百分比總和,作為待檢樣本的差異序列 對應片段百分比總量的實際值;
(4)根據上述來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值、來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值以及待檢樣本的差異序列對應片段百分比總量的實際值,計算得到待檢樣本中源自細胞凋亡的DNA的濃度。
cfDNA是來自于骨髓中性粒細胞凋亡的DNA片段,該種DNA片段由細胞內限制性內切酶切割全基因組DNA而來,限制性內切酶對DNA的切割是有一定偏向性的,本發明根據該原理設計了上述定量樣本源自細胞凋亡的DNA濃度的方法,在假定血漿游離DNA皆源自細胞凋亡的基礎上,以比對到人類參考基因組上的測序序列5’端、可顯著區分游離DNA和機械打斷的組織DNA的差異序列的含量特征,實現對樣本中源自細胞凋亡的DNA濃度的定量。
具體地,本發明的實施方式所提供的定量樣本中源自細胞凋亡的DNA濃度的方法中,步驟(4)中的根據來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值、來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值以及待檢樣本的差異序列對應片段百分比總量的實際值,計算得到待檢樣本中源自細胞凋亡的DNA的濃度的計算式為:
p×PScf+(1-p)×PSg=PSt]]>
其中:
p為要計算的待檢樣本中源自細胞凋亡的DNA的濃度;
為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
為待檢樣本的差異序列對應片段百分比總量的實際值。
優選地,本發明的實施方式所提供的定量樣本中源自細胞凋亡的DNA濃度的方法中,獲取步驟(1)中的血漿游離DNA樣本和機械打斷的組織DNA樣本的方法為:抽取健康人的血液,進行第一次離心,得到上清液和沉淀,取沉淀,再進行機械打斷,即為機械打斷的白細胞樣本,作為機械打斷的組織DNA樣本;對第一次離心得到的上清液進行第二次離心,去掉沉淀,取上清液,即為血漿游離DNA樣本。
優選地,本發明的實施方式所提供的定量樣本中源自細胞凋亡的DNA濃度的方法中,步驟(1)中的統計差異序列集合的方法為:
記比對到人類參考基因組上的測序序列5’端k個堿基的序列為Kmer,k為自然數;記差異序列集合為S;記游離DNA樣本組為Gcf組,記組織DNA樣本組為Gg組:
(1)根據Kmer的不同分別對Gcf組和Gg組的測序序列進行分組,統計每組序列的比例:
PKmerj=NKmerjΣNKmerj]]>
其中:
表示樣本j的測序序列中,5’端以Kmer開始的序列在所有測序序列中的比例、
表示樣本j的測序序列中,5’端以Kmer開始的序列的條數、
表示樣本j的所有測序序列的條數;
(2)統計在Gcf和Gg組中具有顯著差異的kmer:
分別計算和
PKmercf=ΣcfPKmerjΣcfj]]>
PKmerg=ΣgPKmerjΣgj]]>
其中:
依次表示在Gcf組和Gg組中5’端為特定Kmer的序列在每個樣本的測序序列中的含量比例的平均值、
依次表示在Gcf組和Gg組中5’端為特定Kmer的序列在每個樣本的測序序列中的含量比例的總和、
∑cfj、∑gj依次表示Gcf組和Gg組中樣本的個數;
比較上述和選取的所有Kmer作為集合S,其中,N>1。
優選地,上述K和N的取值優選為:K為1~10,1<N≤10。更進一步地,對S集中Kmer的約束為第一個堿基為G或者C;N的取值方法如下:對于特定的K的取值,根據步驟(4)可計算出一系列的差異集合S,對于特定的S,計算Gcf組的每個樣本的PS,PS表示樣本序列5’端的Kmer屬于S集的序列占總序列的百分比,計算所有Gcf組中PS集的標準差sd;計算Gg組樣本的PS;在保證步驟(4)中Gcf組中PS集和Gg組中PS集顯著差異的約束下,取使得sd極小的N值。
進一步地,本發明的實施方式所提供的定量樣本中源自細胞凋亡的DNA濃度的方法中,步驟(2)中計算游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值的公式為:
Pscf=ΣKmer∈SPKmercf]]>
其中:
為要計算的來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
表示血漿游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和。
進一步地,本發明的實施方式所提供的用于定量樣本中源自細胞凋亡的DNA濃度的方法中,步驟(2)中計算組織DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值的公式為:
Psg=ΣKmer∈SPKmerg]]>
其中:
為要計算的來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值;
表示組織DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和。
更進一步地,本發明的實施方式所提供的用于定量樣本中源自細胞凋亡的DNA濃度的方法,其特征在于,步驟(3)中計算待檢樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為待檢樣本的差異序列對應片段百分比總量的實際值的公式為:
Pst=ΣKmer∈SPKmert]]>
其中:
為要計算的待檢樣本的差異序列對應片段百分比總量的實際值;
表示待檢樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和。
此外,本發明還提供上述定量樣本中源自細胞凋亡的DNA濃度的方法的應用,根據計算得到的待檢樣本中源自細胞凋亡的DNA的濃度值,可以用于對游離DNA樣本的質控,或用于檢測組織壞死。
附圖說明
圖1是實施例1中來自于血漿游離DNA樣本所有比對到人類參考基因組上的序列位置-堿基百分比分布圖;
圖2是實施例1中來自于機械打斷的組織DNA樣本所有比對到人類參考基因組上的序列位置-堿基百分比分布圖。
具體實施方式
為使本發明的目的、技術方案和優點更加清楚,下面將結合附圖對本發明的各實施方式進行詳細的闡述。然而,本領域的普通技術人員可以理解,在本發明各實施方式中,為了使讀者更好地理解本申請而提出了許多技術細節。但是,即使沒有這些技術細節和基于以下各實施方式的種種變化和修改,也可以實現本申請各權利要求所要求保護的技術方案。
實施例1
1.樣本采集:
對人群隨機取樣,取得M個健康人的血液,分離得到兩種樣本,血液中 的游離DNA樣本,血液中的白細胞樣本。采樣方法如下:
抽取健康人的血液7ml血液,進行第一次離心,得到上清液和沉淀,取沉淀,再進行機械打斷,即為機械打斷的白細胞樣本,作為機械打斷的組織DNA樣本;對第一次離心得到的上清液進行第二次離心,去掉沉淀,取上清液,即為血漿游離DNA樣本。
將游離DNA樣本組記為Gcf,其中第i個樣本記為
將白細胞樣本組記為Gg,其中第i個樣本記為
2.統計差異序列集合S:
將步驟1中獲得的樣本進行DNA抽提,測序,并將測序獲得的序列比對到人類參考基因組上(hg38),根據比對到hg38上的序列5’端特征可顯著分離Gcf、Gcf組樣本,Gcf、Gg組樣本內部特征值穩定。附圖1為采用fastqc獲得的來自于血漿游離DNA樣本所有比對到人類參考基因組上的序列位置-堿基百分比分布圖;附圖2為采用fastqc獲得的來自于機械打斷的DNA樣本所有比對到人類參考基因組上的序列位置-堿基百分比分布圖。可以看到,在序列中第1~10個堿基長度位置上的堿基百分比分布差異較顯著,因此本發明的實施方式中,優選從序列5’端1~10個堿基的序列中篩選差異序列集合,即N優選取值為1~10。
統計差異序列集合S的具體步驟如下:
采得第j個樣本,記為Gj,對Gj進行DNA測序,得到DNA序列片段r的集合Rj,根據序列片段r的5’端k個堿基的序列(記為Kmer)的不同將Rj分為4k組,如:
k=1,可以將序列分為4k=4組,依次記為
k=2,可以將序列分為4k=16組,依次記為
k=3,可以將序列分為4k=64組,依次記為
……
k=10,可以將序列分為4k=410組,依次記為
統計每組序列的比例如:
k=1,PAj=NAjΣNKmerj,]]>其中
表示樣本j的測序序列中,5’端以A堿基開始的序列在所有測序序列中的比例;
表示樣本j的測序序列中,5’端以A堿基開始的序列的條數;
表示樣本j的所有測序序列的條數。
依次可以得到:PGj=NGjΣNKmerj,PCj=NCjΣNKmerj,PTj=NTjΣNKmerj.]]>
類似地,
k=2,PAAj=NAAjΣNKmerj,......;]]>
……
k=10,PAAAAAAAAAAj=NAAAAAAAAAAjΣNKmerj,.......]]>
下面統計在Gcf和Gg組中有顯著差異的Kmer,計算方法如下:
計算
PKmercf=ΣcfPKmerjΣcfj]]>
其中,
表示在Gcf組中5’端為特定Kmer的序列在每個樣本的測序序列中 的含量比例的平均值;
表示在Gcf組中5’端為特定Kmer的序列在每個樣本的測序序列中的含量比例的總和;
∑cfj表示Gcf組中樣本的個數。
類似地,可以計算得到:
比較和選取的的所有Kmer作為特征集合,記為S。
當k=3,N=2時,獲得的差異序列集合S包括表1所示Kmer:
表1:差異序列集合
GGACGACGCGGTGCAGGCGCTCGTCCAGCCCCTCCC
3.計算和
計算游離DNA樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于細胞凋亡樣本的差異序列對應片段百分比總量的估計值:
Pscf=ΣKmer∈SPKmercf]]>
計算白細胞樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的序列百分比總和,作為來自于非細胞凋亡樣本的差異序列對應片段百分比總量的估計值:
Psg=ΣKmer∈SPKmerg]]>
當k=3,N=2時,和的具體值如下表2所示(表2中, cfDNA1~cfDNA19對應的是值,gDNA1~gDNA3對應的是值。)
表2:和值統計
cfDNA10.2969490cfDNA20.3021332cfDNA30.2977504cfDNA40.2921124cfDNA50.2920593cfDNA60.3023916cfDNA70.2944033cfDNA80.3068457cfDNA90.3066501cfDNA100.3003675cfDNA110.3056995cfDNA120.2965661cfDNA130.2893171cfDNA140.3030564cfDNA150.2970602cfDNA160.2970602cfDNA170.3051699cfDNA180.3039453cfDNA190.3075782gDNA10.1049204gDNA20.1029031gDNA30.1035066
根據上表結果,本實施例中計算得到:
PScf=0.299848179]]>
PSg=0.1037767]]>
4.計算
計算待檢樣本組比對到人類參考基因組上的測序序列中,所有5’端為差異序列的片段的百分比總和,作為待檢樣本的差異序列對應片段百分比總量的實際值:
Pst=ΣKmer∈SPKmert]]>
本實施例中求得:
5.計算待檢測樣本中源自細胞凋亡的DNA的濃度p。
p×PScf+(1-p)×PSg=PSt]]>
根據上式可得:
其中,將前述步驟中求得的和的值代入上式中,求得本實施例中待檢樣本中源自細胞凋亡的DNA濃度為:96.65511%。
本領域的普通技術人員可以理解,上述各實施方式是實現本發明的具體實施例,而在實際應用中,可以在形式上和細節上對其作各種改變,而不偏離本發明的精神和范圍。

關于本文
本文標題:定量樣本中源自細胞凋亡的DNA濃度的方法及其應用.pdf
鏈接地址:http://www.wwszu.club/p-6369588.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
鬼佬大哥大