氨基酸骨架结构
AI预测蛋白结构
蛋白质对生命来说不可或缺,它们支持生物体的几乎所有功能。而蛋白质的功能很大程度上决定于它的3D结构。了解蛋白质的结构和形状对医药研究的进步至关重要。生物医学领域的众多挑战,包括开发治疗疾病的创新疗法,都依赖于对蛋白质结构和功能的理解。
由于蛋白质结构极其复杂,到现在为止,医学上也只研究出少数蛋白质的构造。自从AlphaFold2和RoseTTaFold的横空出世,人工智能正被用来预测人体产生的几乎每一种蛋白质的结构。蛋白建模完成后,需要有一个通用的指标为其进行评估。
目前应用最广的评估指标包括PROCHECK、VERIFY_3D和 PROSA。PROCHECK用于评估模型三维结构的立体化学参数,结果可用Ramachandran图表示,横坐标为多肽蛋白质立体结构中肽键内α碳原子和羰基碳原子间的键的旋转度 psi(ψ),纵坐标为 α 碳原子和氮原子间的键的旋转度phi(?),理论上psi和phi都可自由变化,但键的转动会带动其它原子一起转动,因此受分子各个基团的空间障碍和作用力的影响,Ramachandran图中就出现了氨基酸的允许区域和不允许构象区域;VERIFY_3D常用来确定模型三维结构和它自身氨基酸序列之间的兼容性;而 PROSA 常用于判断蛋白质氨基酸残基间相互作用能的合理性。
Ramachandran图
PROCHECK
PROCHECK是最常用的蛋白质几何形状评估工具之一,主要用于评价蛋白质结构的立体化学参数,它不仅适用于实验过程中已经结晶的蛋白,对同源建模所得模型也同样适用。它忽略蛋白质系统的能量,主要研究氨基酸残基碳骨架的二面角在蛋白质或多肽链中的分布情况,并生成Ramachandran统计图。该图被不同颜色的曲线划分为 4 部分,分别是最合理区(the most favored regions),其它合理区(the additional allowed regions),一般合理区(the generous allowed regions),不合理区(the disallowed regions)。从Ramachandran 图中我们可以得到各个氨基酸残基之间的二面角φ 、ψ,当不少于90%的二面角分布在最佳合理区时,则蛋白质的结构是合理的。
http://www.csb.yale.edu/poststructure/procheck/procheck.html
VERIFY_3D
VERIFY_3D对同源建模所得模型的质量进行了可视化分析,主要是用来判断模型与其本身氨基酸序列之间的兼容性,对氨基酸残基数大于100的蛋白质,VERIFY_3D的评估结果更准确。一般当不低于80%的氨基酸残基得分大 0.2时,即可认为目的蛋白建模所得模型属于高质量的模型结构。
https://servicesn.mbi.ucla.edu/Verify3d/
PROSA
PROSA的评价结果反映的是目的蛋白三维结构氨基酸残基之间的相互作用能,由公式计算得到:
其中 ES,C表示序列S间的残基在C构象空间中的相互作用能,而 êS,C指序列S间的残基在C构象空间的相互作用能的平均值,下面的σS为相对应的标准偏差。将含有目的蛋 白 空 间 结 构 的PDB格 式 的 文 件 上 传 到 在 线 服 务 器(https://www.came.sbg.ac.at/prosa.php)便可得到PROSA的评价结果,计算所得数值ZS,C即为 Z-score,该值通常为负数。在 PROSA 结果图中还包括所有已经实验确定的现存于 RCSB PDB数据库中与目的蛋白大小相近的蛋白质的Z-score值,当目标蛋白的Z-score 值分布在这些已知蛋白的Z-score值绘制的图形范围内时,则证明目标蛋白结构的能量是合理的,反之,则认为结构是不合理的。
https://prosa.services.came.sbg.ac.at/prosa.php
end
注:本推文未经许可禁止转载。
怎么评价“AlphaFold”预测的蛋白结构是否合理呢?,AI预测蛋白结构
主题测试文章,只做测试使用。发布者:氨基酸肥料,转转请注明出处:https://www.028aohe.com/25154.html