当前位置:无忧公文网 >范文大全 > 征文 > 基于DOT的蛋白质—DNA对接研究

基于DOT的蛋白质—DNA对接研究

时间:2022-04-07 10:59:38 浏览次数:

摘要:采用大分子对接程序DOT对20个具有代表性的蛋白质-DNA体系进行对接,对对接结果就各打分项与体系中的带电性问题和构象变化问题之间的具体关系进行分析。结果表明,采用DOT对大部分蛋白质-DNA体系都找到了精确度较高的对接结果;范德华能和静电能对DOT组合能的贡献反映了蛋白质-DNA体系的天然特性;对接面上允许的碰撞原子个数(NB参数)与蛋白质和DNA结合前后溶剂可达表面变化面积(ASA)呈正比关系。

关键词:蛋白质-DNA对接;DOT;构象变化

中图分类号:Q615 文献标识码:A 文章编号:0439-8114(2013)23-5889-05

蛋白质和DNA是构成生命体最为重要的两类生物大分子,在基因表达调控、蛋白质翻译和细胞分裂等过程中发挥着极其重要的作用[1]。通过研究蛋白质-DNA复合物的相互作用可以了解核酸在生物学过程中所发挥的基础作用,还可以为设计针对核酸的药物提供参考[2]。但是,通过试验方法直接测定蛋白质-DNA复合物结构仍相当困难[3],截至2012年10月28日,蛋白质数据库(Protein data bank,PDB)中数据总数已超过80 000个,而其中蛋白质-DNA复合物结构却不足2 500个,如果考虑结构之间的同源性,则保留下来的结构就更少了。因此分子对接作为重要的复合物结构预测模拟方法之一,可为复合物结构预测提供有益的参考依据[4,5]。

目前,关于蛋白质-蛋白质对接,蛋白质-DNA对接的研究进展缓慢。主要困难在于:第一,缺乏蛋白质的氨基酸和DNA的碱基对之间有关识别模式的信息[6];第二,DNA的带电性更加复杂,尤其是核糖磷酸盐骨架的带电性问题大大增加了评估系统静电能量稳定性的难度;第三,核酸在结合过程中发生的构象变化比较大。在蛋白质跟核酸的结合过程中,除了蛋白质的边链会发生构象变化外,DNA的螺旋结构也有可能发生全局的构象变化,例如弯曲和解螺旋[7]。

本研究把大分子对接程度DOT应用在蛋白质-DNA的对接中,并对对接结果进行分析,目的在于找出具有普遍意义的蛋白质-DNA对接方法中各打分项与体系中的带电性问题和构象变化问题之间的具体关系,以期有助于今后研究具有更高精确度的蛋白质-DNA对接方法。

1 材料与方法

1.1 DOT程序介绍

DOT是由Mandell等[8]开发的适用于大分子快递对接的程序。它的打分项只包含范德华能和静电能2项,通过运用卷积定理分别把静电能函数和范德华能函数改写成相关函数形式,再引入傅里叶变换把计算复杂度从N2降至NlogN,由此得到的高效DOT特别适合应用于研究蛋白质-DNA此类比较大的复合物体系上。此外,由于蛋白质-DNA体系中DNA的强带电性以及在结合过程中发生的构象变化[9]会分别反映在静电能和范德华能2个打分项上,因此选用DOT对蛋白质-DNA体系进行对接,对后续的结果分析更有针对性。

1.2 试验数据来源及预处理

本研究从Van Dijk等[10]的蛋白质-DNA数据集中选取了具有代表性的20个体系进行分析。根据蛋白质和DNA对接时发生构象变化的程度,这些体系被划分为低、中、高3个不同级别的难度。这个数据集包含了蛋白质和DNA的结合态与非结合态结构,有利于研究蛋白质-DNA对接过程中发生的柔性变化。其中,对于非结合态和结构不完整的结合态DNA,用3DNA程序[11]按照B型双螺旋结构对DNA进行修补,由于这些缺失的碱基一般出现在DNA双链的两端,因此不会对后续的对接产生影响。为了模拟化合物中氢键所产生的作用,用REDUCE程序[12]为受体和配体加上极性氢原子。为了检验不同体系在结合过程中受静电能和范德华能影响的差异,选取在规模方面具有代表性的体系进行试验,具体表现为带电性和溶剂可达表面积(ASA)这两个体系参数的差异度上,具体见表1。从表1中可以看到,1bdt、1f4k、1tro等体系都具有比较强的带电性,而ASA值则相对较小;相反,1rva、2fl3、2oaa等体系中复合物的ASA值比较大,而体系的带电性则相对较小。

1.3 试验方法

本试验对选取的20个蛋白质-DNA体系中蛋白质和DNA的结合态以及非结合态结构进行了不同的组合,分别是蛋白质和DNA的结合态-结合态(B/B)、结合态-非结合态(B/U)、非结合态-结合态(U/B)以及非结合态-非结合态(U/U)。另外,对每个体系的所有组合在对接面上允许的碰撞原子个数参数进行调整,以观察蛋白质-DNA体系在对接过程中所发生的构象变化程度。所有体系都以蛋白质为受体,DNA为配体,在刚性对接阶段配体围绕受体每次旋转6 °进行采样,最后得到54 000个构象结果,并以DOT复合打分函数对这些构象进行打分并排序。

2 结果与分析

2.1 对接结果

DOT对20个体系的蛋白质结合态-DNA结合态组合进行对接的结果见表2。取能量最优的前30 000个结果,以复合物天然构象中的DNA和对接结果中的DNA重原子之间的RMSD值作为评判标准,从表2可以看出,除了1b3t和1tro以外其他体系都找到了RMSD值小于3 ?魡的结果。对每个体系取适当的RMSD阀值,考察DOT组合能、静电能和范德华能在阀值以内找到的位于前100名最优能量的结果数量,以及排名最高的结果和其对应的RMSD值。除了1bdt和1diz以外的大部分体系,DOT都可以在前100位的结果中找到阀值以内的较优构象。对于体系1emh、1rva、1tro、1vas、7mht,即使在单独用静电能或者范德华能作为打分函数时找不到较优结果的情况下,在DOT组合能中也可以找到较优的结果。从整体上来说,DOT组合能找到最优结果数量的能力也要强于静电能和范德华能。

2.2 范德华能和静电能对对接结果的影响

如图1所示,通过分析体系中蛋白质和DNA的带电性以及溶剂可达表面积的变化,考查静电能和范德华能对DOT组合能的影响程度。发现有以下3种情况:①图1A为1zme体系中B/B组合前200位对接结果各能量之间的关系图,可以看出静电能在DOT组合能中占有主导地位,这跟1zme体系的强带电性是相匹配的;②图1B为2oaa体系中B/B组合前200位对接结果各能量之间的关系图,从图中可以看到范德华能在DOT组合能中占有主导地位,这与2oaa体系中蛋白质和DNA溶剂可达表面积的明显变化是相匹配的;③图1C是1hjc体系中B/B组合前200位对接结果各能量之间的关系图,可以看到范德华能和静电能对DOT组合能的贡献都相对平均,这与1hjc体系带电性不强,蛋白质和DNA溶剂可达表面积变化不大是匹配的。

2.3 构象变化分析

图2为体系1azp、2irf、1by4、1k79、1b3t、2fl3的对接结构图。第1组体系1azp、2irf的ASA值较小,在1 000 ?魡2以下;第2组体系1by4、1k79的ASA值适中,约为1 500 ?魡2;第3组体系1b3t、2fl3的ASA值最大,在2 000 ?魡2以上。从图2中可以看到,3组体系B/B组合的对接结果都几乎与天然结构重合,而B/U组合的对接结果则随着ASA值的增大而变差。这是由于ASA值度量的是蛋白质和DNA在结合前后于接触面上发生的溶剂可达表面积变化的程度,它与复合物对接后的构象变化有着直接关系。对于构象变化越大的体系,使用非结合态DNA结构作为配体进行对接的难度就越大。

本研究通过调整DOT程序的NB(number of bumps)参数以研究不同体系的构象变化情况。NB参数表征了蛋白质和DNA在结合过程中接触面上允许发生碰撞的原子个数。在实际情况中,DNA在与蛋白质的结合过程中是不可能侵入到蛋白质内部的,也就是其原子不可能发生碰撞,但适当放松允许发生碰撞的原子个数,可以模拟结合过程中在接触面上发生的构象变化。由于在蛋白质和DNA的对接中,DNA的双螺旋结构往往会发生一定程度的构象变化,因此NB参数的取值对结果的影响非常大。体系ASA值的大小某个程度上表征了构象变化的程度,因此考察NB参数和ASA值之间的关系,实际上反映了NB参数和体系构象变化程度之间的关系。

从图3可以看出,对于不同体系的包含非结合态结构的组合中,当体系的ASA值较小时,对接结果的RMSD值随着NB参数的增大而增大;当体系的ASA值适中时,对接结果的RMSD值在NB参数为中间范围值时最小;当体系的ASA值较大时,对接结果的RMSD值随着NB参数的增大而减小。图3A中的曲线总体呈上升趋势,说明对接的最优解都出现在NB参数取值较小处,配体DNA基本不需要通过模拟的碰撞来调整结构就可以跟受体蛋白质进行精确的对接,这与体系的ASA值较小,在对接前后基本没有发生构象变化相匹配。图3B中的曲线最低点基本出现在中部,说明对接的最优解在NB参数取靠近中间值,通过允许配体DNA的原子与蛋白质原子发生轻微碰撞以适应对接过程中发生的构象变化,这与体系的ASA值都在1 500 ?魡2左右的中间位置,并且在对接前后发生的轻微构象变化相匹配。图3C中的曲线总体上呈下降趋势,说明对接的最优解在NB参数取值较大处,通过加大配体DNA原子与蛋白质原子在接触面上的碰撞个数以模拟大范围的构象变化来提高对接精度,这与体系的ASA值都在2 000 ?魡2以上,在对接前后发生的明显构象变化相匹配。

3 小结与讨论

本研究使用大分子对接程序DOT对蛋白质-DNA的对接方法进行了研究,结果如下。

1)DOT对不同体系的蛋白质-DNA对接具有普遍适用性,在相对短的时间里能够找出接近天然结构的构象。

2)对于带电性比较强的体系,静电能在蛋白质和DNA的结合过程中占主导地位;对于在结合过程中发生的柔性变化比较大的体系,范德华能在蛋白质和DNA的结合过程中占主导地位。在此结论的基础上,为了提高对接方法的精确度,对于已知带电性较强的蛋白质-DNA体系,可在打分函数中适当加大静电能的权重;而对于已知带有柔性特征结构的体系,例如弯曲和解螺旋,可在打分函数中适当加大范德华能的权重。

3)在DOT对接程序中,根据体系ASA值的不同情况,可通过调整NB参数使对接结果的RMSD值尽量优化。这表明对于已知在结合位点上带有易于发生构象变化结构的体系,可根据特定结构发生构象变化程度的经验数据来调整NB参数,从而提高对接的成功率。

在本研究中,虽然DOT对大部分蛋白质-DNA体系都可以找到精确度较高的结果,但是这些结果的排名并不好,因此通过改进DOT打分函数对结果进行二次排序,以提升高精度结果的排名将成为今后的研究重点。

参考文献:

[1] YANG W, VAN DUYNE G D. Protein-nucleic acid interactions: From A(rgonaute) to X(PF)[J]. Current Opinion in Structural Biology,2006,16(1):1-4.

[2] GAN J H, JIA S, ZHEN H. Chemical and structural biology of nucleic acids and protein-nucleic acid complexes for novel drug discovery[J]. Science China Chemistry,2011,54(1):3-23.

[3] VELANKAR S, BEST C, BEUTH B, et al. PDBe: Protein data bank in Europe[J]. Nucleic Acids Research,2010,38(1):308-317.

[4] RITCHIE D W. Recent progress and future directions in protein-protein docking[J]. Current Protein and Peptide Science,2008,9(1):1-15.

[5] VADJDA S, KOZAKOV D. Convergence and combination of methods in protein-protein docking[J]. Current Opinion in Structural Biology,2009,19(2):164-170.

[6] GAO M, SKOLINICK J. From nonspecific DNA-protein encounter complexes to the prediction of DNA-protein interactions[J]. PLoS Computational Biology,2009,5(3):1-12.

[7] VAN DIJK M, VAN DIJK A D J, HSU V, et al. Information-driven protein-DNA docking using HADDOCK: It is a matter of flexibility[J]. Nucleic Acids Research,2006,34(11):3317-3325.

[8] MANDELL J G, ROBERTS V A, PIQUE M E, et al. Protein docking using continuum electrostatics and geometric fit[J]. Protein Engineering Design & Selection,2001,14(2):105-113.

[9] 刘董敏,常 珊,胡建平,等.蛋白质-核酸对接方法研究进展[J]. 现代生物医学进展,2012,12(5):979-983.

[10] VAN DIJK M, BONVIN A M J J. A protein-DNA docking benchmark[J]. Nucleic Acids Research,2008,36(14):88.

[11] LU X J, OLSON W K. 3DNA: a versatile, integrated software system for the analysis, rebuilding and visualization of three-dimensional nucleic-acid structures[J]. Nature Protocols,2008,3(7):1213-1227.

[12] WORD J M, LOVELL S C, RICHARDSON J S, et al. Asparagine and glutamine: using hydrogen atom contacts in the choice of side-chain amide orientation[J]. Journal of Molecular Biology,1999,285(4):1735-1747.

推荐访问: 对接 蛋白质 研究 DOT DNA