搜索
您的当前位置:首页焦磷酸测序技术的原理

焦磷酸测序技术的原理

来源:乌哈旅游
Pyrosequencing技术的原理

Pyrosequencing是一项全新的DNA测序技术,可以快速、准确地测定一段较短的目标片段。其基本原理如下:

第1步:1个特异性的测序引物和单链DNA模板结合,然后加入酶混合物(包括DNA Polymerase、ATP Sulfurylase、Luciferase和Apyrase)和底物混合物(包括APS和Luciferin)。

第2步:向反应体系中加入1种dNTP,如果它刚好能和DNA模板的下一个碱基配对,则会在DNA 聚合酶的作用下,添加到测序引物的3‘末端,同时释放出一个分子的焦磷酸(PPi)。

第2步图示(图片来自互联网)

第3步:在ATP硫酸化酶的作用下,生成的PPi可以和APS结合形成ATP;在荧光素酶的催化下,生成的ATP又可以和荧光素结合形成氧化荧光素,同时产生可见光。通过CCD光学系统即可获得一个特异的检测峰,峰值的高低则和相匹配的碱基数成正比。

第3步图示(图片来自互联网)

第4步:反应体系中剩余的dNTP和残留的少量ATP在Apyrase的作用下发生降解。

第4步图示(图片来自互联网)

第5步:加入另一种dNTP,使第2-4步反应重复进行,根据获得的峰值图即可读取准确的DNA序列信息。

第4步图示(图片来自互联网)

Pyrosequecing技术操作简单,结果准确可靠,可应用于SNP位点检测、等位基因频率测定、细菌和病毒分型等领域。

具体事例

【摘要】 建立了一种将序列标记反转录聚合酶链反应(PCR)与焦磷酸测序技术结合的相对基因表达量测定法(简称“SRPP”)。先用来源特异性引物对不同来源的同一基因通过反转录标记上特异性标签,PCR后用焦磷酸测序法对扩增产物进行序列解码,使得测序结果中的序列代表基因的来源,峰高代表基因在不同来源中的相对表达量。用实时荧光定量PCR法对本方法的准确性进行了验证,结果表明,SRPP可以同时准确测定同一基因在3个不同来源中的表达量,并实际测定了Egr1基因在糖尿病、肥胖和正常小鼠肝中的表达量差异。 【关键词】 序列标记反转录, 聚合物链反应,焦磷酸测序,基因表达 1 引 言

差异表达基因与疾病密切相关,深入研究可在基因水平揭示疾病的发病机制。目前,用于检测基因表达水平的技术主要有SAGE法[1]、实时荧光定量PCR法[2,3]和基因芯片法[4]等。但这些方法存在仪器设备昂贵、定量性能差以及同时测定基因表达量的来源数目受限等缺点。

焦磷酸测序技术是新近发展起来的一种基于酶催化化学反应的测序技术[5~8],不需要使用荧光标记,定量性能好。目前,焦磷酸测序技术多用于单核苷酸多态性(SNP)分析、微生物分型和基因甲基化分析等。本研究将焦磷酸测序技术用于基因表达量差异的比较分析,考察了其可行性和准确性,并将其应用于检测Egr1基因在糖尿病、肥胖症和正常小鼠中的差异表达。 2 实验部分

2.1 仪器、试剂与材料

21R型台式高速冷冻离心机(美国Beckman公司);Gene SpeⅢ微量核酸蛋白测定仪(日本Naka Instrument公司);PTC225 PCR扩增仪、Opticon实时荧光PCR仪(美国MJ Research公司)。焦磷酸测序装置由本实验室自行组装

[9,10]。此装置主要由焦磷酸测序反应模块、荧光信号放大和数据采集3部分组成。反应模块由位于中间的反应池通过毛细管与四周的dNTP储液池相连组成。通过注射器施压使4种dNTP循环加入反应池完成测序反应。荧光信号通过R6335光电倍增管(日本Hamamatsu Photonics K.K.公司)放大后,经BPCL微弱发光测量仪(北京中国科学院生物物理研究所)采集数据。

Hotstar Taq DNA聚合酶、Omniscript RT kit反转录试剂盒(德国Qiagen公司);Trizol(上海Inviotrogen公司);荧光素、荧光素酶、三磷酸腺苷硫酸化酶、三磷酸腺苷双磷酸酶和5′磷酸化硫酸腺苷(美国Sigma公司); DynabeadsM280链霉亲和素磁珠(挪威Dynal AS公司); Klenow DNA 聚合酶(美国Promega公司);所有引物均由上海Invitrogen公司合成。

实验中用到的糖尿病、肥胖和正常小鼠的肝组织由南京师范大学生命科学学院提供。

2.2 RNA的提取

用Trizol试剂盒抽提RNA,用紫外分光光度法测定RNA浓度及纯度。 2.3 反转录合成cDNA第一链

取等量的不同来源的总RNA,分别以来源特异性反转录引物反转录。即取总RNA 0.05~2.0 μg至Nucleasefree的小管中,加DEPCH2O至12 μL;65 ℃反应5 min后,置冰上至少1 min;在上述各小管中加入10×第一链合成缓冲液2 μL,0.5 mmol/L dNTP混合物,10 U RNase 抑制剂,200 U Omniscript Reverse Transcriptase,1 μmol/L反转录引物,加DEPCH2O至总体积为20 μL。反转录条件为:37 ℃ 反应1 h, 93 ℃反应5 min,然后中止反应。 2.4 基因特异性PCR

不同来源的cDNA等比例混合,以共用引物CP(5′CCA TCT GTT CCC TCC CTG TC3′)和生物素标记的基因特异性引物(GSP)进行扩增反应。PCR体系为: cDNA等比例混合液1 μL, 0.3 μmol/L CP和GSP,1.5 mmol/L Mg2+, 0.2 mmol/L dNTP 混合物,10×PCR 缓冲液 5 μL,5×Q 溶液 10 μL , 1 U HotStar Taq DNA聚合酶,并加入灭菌蒸馏水至50 μL。PCR反应程序为: 94 ℃ 变性 15 min,热循环35次(94 ℃, 40 s; 60 ℃, 40 s; 72 ℃, 1 min ), 72 ℃延伸10 min, 4 ℃保存。基因特异性引物的序列见表1。表1 实验用引物 2.5 焦磷酸测序固相单链模板的制备

取5 μL戴诺磁珠(Dynabeads),用磁铁吸弃上清液。磁珠以100 μL B&W Buffer(10 mmol/L TrisHCl, pH 7.5, 1 mmol/L EDTA, 2.0 mol/L NaCl)洗涤两遍,最终悬浮于50 μL B&W 缓冲液中;加入50 μL PCR产物,37 ℃反应30 min;用磁铁吸弃上清液,磁珠以180 μL H2O洗涤两遍,加入0.1 mol/L NaOH溶液

20 μL,混匀室温放置5 min使PCR产物变性;磁铁吸弃上清液,磁珠以100 μL B&W 缓冲液洗涤两遍,100 μL 1×退火缓冲液洗一遍,最终溶于8 μL 1×退火缓冲液中;加入1 μL 10 μmol/L测序引物,93 ℃混匀30 s,55 ℃退火3 min,4 ℃保存,待测序用。 2.6 焦磷酸测序反应

焦磷酸测序标准混合液的组成为:0.1 mol/L TrisAc缓冲液(pH 7.7),2 mmol/L EDTA,10 mmol/L Mg(Ac)2,0.1% BSA,1 mmol/L 二硫苏糖醇(DTT),3 μmol/L 5′磷酸化硫酸腺苷(adenosine5′phosphosulfate,APS),0.4 μg/L PVP,0.4 mmol/L D虫荧光素,2×10-4 U/L三磷酸腺苷硫酸化酶,2×10-3 U/L 三磷酸腺苷双磷酸酶,18×10-3 U/L无外切酶活性的Klenow DNA聚合酶,14.6 mg/L荧光素酶。 3 结果与讨论 3.1 方法原理

焦测序技术是一种基于化学发光反应定量测定引物延伸副产物焦磷酸盐(PPi)的测序技术。其原理是:引物与模板DNA退火后, 在DNA 聚合酶

(polymerase)、三磷酸腺苷硫酸化酶(ATP sulfurylase)、荧光素酶(luciferase) 和三磷酸腺苷双磷酸酶(apyrase)的协同作用下完成循环测序反应。当加入的dNTP与模板互补时,DNA模板与互补的dNTP聚合可以产生等摩尔PPi;在三磷酸腺苷硫酸化酶的催化下,PPi与5′磷酸化硫酸腺苷(APS)反应生成等量的ATP;在荧光素酶催化作用下,ATP与虫荧光素(luciferin)反应发出荧光。产生的荧光信号强度与聚合的测序模板量和碱基数成正比,根据加入的dNTP类型和测得的荧光信号强度就可实时记录模板DNA 的核苷酸序列。反应方程式如下: (DNA)n+dNTPpolymerase(DNA)n+l+PPi(1) PPi+APSATP sulfurylaseATP+SO2-4(2)

ATP+Luciferin+O2luciferaseAMP+PPi+Oxyluciferin+CO2+hv(3) dNTPApyrasedNDP+PiApyrasedNMP+Pi(4) ATPApyraseADP+PiApyraseAMP+Pi(5)

为了定量测定基因表达量差异,本研究将碱基序列标记法与焦磷酸测序解码技术相结合,其关键点在于:在不同来源的同一基因中标记上区别样品来源的特异性标签;对标记序列进行解码和定量测定。采用反转录引物将来源特异性碱基标记到各来源待测基因,然后用焦磷酸测序定量测定标记序列。

具体测定过程如图1所示:(1) 用来源特异性反转录引物对不同来源的RNA进行反转录。引物由4部分组成:5′端为共用序列;位于引物中间的4个碱基为

人为设计的来源特异性标签,在图1中以深浅不同的4个小圆点表示;3′端为oligo(dT)n和用于固定oligo(dT)n位置的两个兼并碱基。来源特异性反转录引物的碱基组成和数目都相同,只是位于中间的来源特异性碱基的排列位置有所差异;(2) 不同来源的cDNA稀释后等比例混合;(3) 用生物素标记的基因特异性引物和共用引物扩增上述混合物,通过改变基因特异性引物就可以进行任何基因的表达量差异分析;(4) 用磁性微球技术将PCR产物制备成单链,根据来源特异性反转录引物中来源标签序列进行焦磷酸测序。测序结果中,各来源特异性碱基的相对峰高即代表相对基因表达量差异。本方法称之为SRPP法(Sequencetagged reversetranscription PCR with pyrosequencing)。 图1 碱基序列标记法结合焦磷酸测序解码技术测定基因表达量差异的原理图

Fig.1 Principle of comparative gene expression analysis by coupling sequencetagged reversetranscription polymerase chain reaction(PCR) with pyrosequencing (SRPP)由于不同来源的同一基因在单管中只用一对引物进行PCR,并且扩增产物的碱基组成和含量完全一样,仅4个碱基的排列顺序不一样,具有相同的保留时间。所以来源不同,表达量不同的同一基因在单管中能实现等比例扩增。SRPP测定峰高比值也即能代表起始基因的相对表达量。 3.2 焦磷酸测序的定量特性

在同一焦磷酸测序反应体系中,产生的荧光信号强度与ATP的量成正比,而ATP的量与聚合的dNTP 个数成正比,所以可以根据图谱中测得的信号强度推测出模板DNA相对含量。为了验证焦磷酸测序的定量特性,人为设计了一条测序单链(5′GG TT CC AA G T C A CCCCGCCCGC3′ )和一条测序引物(5′GCGGGCGGGG3′),使测序单链的3′端与测序引物单链的5′端完全互补。两条单链退火后按dTTP→dGTP→dATPαS→dCTP的顺序循环递加dNTP进行测序反应。结果显示,待测模板上测序引物的延伸序列为“T G A C TT GG AA CC”12个碱基,其信号强度跟同质区的相同碱基个数成正比。这一结果表明,峰强度与被引物延伸模板的量成正比,可通过测定各峰的峰高之比确定对应的模板的相对含量。本研究利用焦磷酸测序技术的定量特性,通过测序图谱中的峰高比值分析不同来源的基因相对表达量。

3.3 来源特异性基因的标记及标记模板的等比例扩增

SRPP法定量的关键在于能否在单管中等比例扩增经标记的不同来源的同一基因。为了验证SRPP法是否具有此特性,人工模拟了一系列Actb基因的3个不同来源(分别命名为“来源G”,“来源T”和“来源C”)进行测定。具体方法为取同一来源的RNA样品分成3等份,分别用来源特异性反转录引物RTG(5′CCA TCT GTT CCC TCC CTG TC gatc ttt ttt ttt ttt ttt VN3′), RTT(5′CCA TCT GTT CCC TCC CTG TC tacg ttt ttt ttt ttt ttt VN3′)和RTC (5′CCA TCT GTT

CCC TCC CTG TC catg ttt ttt ttt ttt ttt VN3′)进行反转录反应,使反转录产物分别被标记上“来源G”、“来源T”和“来源C”的特异性标签(上述序列中的带下划线的斜体部分)。然后将上述经标记的cDNA模板,分别以1∶1∶1, 5∶1∶1, 1∶5∶1和1∶1∶5(来源G∶来源T∶来源C)的体积比混合,作为系列人工模拟模板分别进行PCR扩增,测定结果如图2所示,序列中的第一个碱基“G”代表“来源G” 的模板;第二个碱基“T”代表“来源T”的模板;第三个碱基“C”代表“来源C” 的模板。3个碱基信号峰的相对强度代表着Actb基因在3个不同来源中的相对表达量。通过计算峰高的比值即可得到所测基因在不同来源中的表达差异。 由于dNTP不稳定,存在少量的分解产物PPi,在焦磷酸测序中可能会出现背景峰,影响结果的准确性。为此,焦磷酸测序中每种dNTP都连续加入两次,所以图2中每次焦磷酸测序都出现6个峰。其中第1次得到的峰为信号峰,第2次为dNTP背景峰,计算结果时要在信号强度中扣除背景。3种来源模板等量混合(1∶1∶1)的测序结果如图2A所示,测得的峰高比为1.1∶1.0∶1.0 (来源G∶来源T∶来源C),此测定值与模板理论比例1∶1∶1十分相近;如图2(B~D)所示, 图2 Actb基因在不同人工模拟3种来源中的表达量差异测序图谱,3种来源的理论表达量比为1∶1∶1(A), 5∶1∶1(B), 1∶5∶1(C)和1∶1∶5(D)(每种dNTP都连续加入两次以扣除其背景吸收)

Fig.2 Pyrograms of simulated templates prepared by pooling three sourcespecific cDNAs at the ratios of 1∶1∶1 (A), 5∶1∶1 (B), 1∶5∶1 (C), and 1∶1∶5 (D), respectively. PCR was performed by using the common primer and the Actb genespecific primer. Each deoxyribonucleoside

triphosphate(dNTP) was dispensed twice for detecting the background due to pyrophosphoric acid(PPi) impurity in dNTP solution模板比例为5∶1∶1, 1∶5∶1 和1∶1∶5 的SRPP测定结果分别为:5.1∶1.0∶1,0.97∶4.8∶1和0.2∶0.2∶1。结果表明,不同比例的各标记模板(各模板的差别仅是4个碱基的排列序列不同)得到了等比例扩增,没有序列歧视性,即通过测定扩增产物的比例就可以间接得到不同来源中基因的表达量差异。 3.4 准确性实验

为进一步验证本方法的准确性,将本方法的测定结果与实时荧光定量PCR法进行比较。采用本方法平行测定2次,Actb基因在小鼠肾、心和脑中的相对表达量之比分别为38.8∶19.8∶41.3和40.0∶19.5∶40.5。平均值为39.4∶19.6∶40.9。同时采用实时荧光定量 PCR测得Actb基因在肾、心和脑中的相对表达量比值为37.8∶22.0∶40.2。与两种方法测定结果一致, 说明SRPP可以用于准确测定同一基因在不同来源中的表达量差异。3.5 Egr1基因在糖尿病小鼠、肥胖小鼠和正常小鼠肝中的表达量差异的测定

最近研究表明,胰岛素是一种抗炎激素,抑制几种促炎转录因子如 Egr1的基因表述[11]。因此产生胰岛素抗性或者胰岛素作用不正常的糖尿病人,体内促炎转录因子被激活,相应基因的表达量增加。另外肥胖是人体的一个炎症状态[12],炎症参与胰岛素信号传导的干预,产生胰岛素抗性,也会激活这些促炎转录因子,增加相应基因的表达。

本实验将SRPP法应用于模型小鼠Egr1基因表达量差异的研究。研究了3组(a, b, c)共9只小鼠,每组中分别有糖尿病、肥胖和正常小鼠各1只。提取上述小鼠的肝组织的RNA,取等量的RNA反转录,反转录引物为RTG, RTC和RTT,使其产物被人为地标记为“糖尿病G”、“肥胖T”和“正常C”。再将反转录产物等比例混合,以公用引物CP和基因特异性引物bioEgr1GSP进行PCR扩增,焦磷酸测序。为了去除不同来源RNA产量、质量以及逆转录效率上可能存在的差别,选择看家基因Actb作为内参基因进行校正。3组小鼠均按上述方法进行SRPP测定。结果如图3所示(典型焦磷酸测序图谱)。以归一化法计算Egr1和Actb基因在糖尿病、肥胖和正常小鼠肝中的表达量,3组小鼠肝中Egr1基因经看家基因Actb校正后的相对表达量分别为:2.41∶0.34∶1.22, 0.78∶0.49∶2.18和0.54∶0.90∶1.56。同时采用实时荧光定量 PCR对Egr1和Actb基因在上述小鼠肝中的拷贝数进行了定量测定,按相同方法进行数据处理,测得的经Actb校正后的Egr1基因相对表达量分别为2.50∶0.39∶1.08, 0.81∶0.47∶2.46和0.56∶0.87∶1.69。结果见表2。此例说明SRPP方法可以有效地用于研究不同来源的基因表达量。表2 SRPP和实时荧光PCR测定结果

因篇幅问题不能全部显示,请点此查看更多更全内容

Top