氨基酸编码突变
生物学家劳伦斯·赫斯特和斯蒂芬·弗里兰在20世纪90年代末把天然基因密码和计算机随机产生的几百万组密码拿去比对,结果轰动一时。他们想知道,如果发生点突变这种把一个字母换掉的变异,哪一套密码系统能保留最多正确的氨基酸,或将它代换成另一个性质相似的氨基酸。
结果他们发现,天然的基因密码最经得起突变的考验。点突变常常不会影响氨基酸序列,而如果突变真的改变了氨基酸,也会由另一个物理特性相似的氨基酸来取代。据此,赫斯特与弗里兰宣称,天然的遗传密码比成千上万套随机产生的密码要优良得多。它不但不是大自然密码学家愚蠢而盲目的作品,而是万里挑一的密码系统。
天然的三联基因密码的第一个字母都有特定的对应方式。举例来说,所有以丙酮酸为前体合成的氨基酸,它们密码的第一个字母都是T。所有由α-酮戊二酸所合成的氨基酸,其三联密码第一个字母都是C;所有由草酰乙酸合成的氨基酸,第一个字母都是A;最后,几种简单前体通过单一步骤所合成的氨基酸,第一个字母都是G。
三联密码的第二个字母和氨基酸是否容易溶于水有关,或者说和氨基酸的疏水性有关。亲水性氨基酸会溶于水,疏水性氨基酸不会溶于水,但会溶在脂肪或油里,比如溶在含有脂质的细胞膜里。所有的氨基酸,可以从“非常疏水”到“非常亲水”排列成一张图谱,而正是这张图谱决定了氨基酸与第二个密码字母之间的关系。疏水性最强的六个氨基酸里有五个,第二个字母都是T,所有亲水性最强的氨基酸第二个字母都是A。介于中间的有些是G有些是C。
三联密码的第三个字母不含任何信息,不管接上哪一个字母都没关系,这组密码子都会翻译出一样的氨基酸。以甘氨酸为例,它的密码子是GGG,但是最后一个G可以代换成T、A或C。
第三个字母的随机性暗示了一些有趣的事情。二联密码可以编码16种氨基酸。如果我们从20个氨基酸里拿掉5个结构最复杂的(剩下15个氨基酸,再加上一个终止密码子)这样前两个字母与这15个氨基酸特性之间的关联就更明显了。因此,最原始的密码可能只是二联密码,后来才靠“密码子捕捉”的方式成为三联密码,也就是各氨基酸彼此竞争第三个字母。
第一个字母和氨基酸前体之间的关系直截了当,第二个字母和氨基酸的疏水性相关,第三个字母可以随机选择。这套密码系统除了可以忍受突变,还可以降低灾难发生时造成的损失,同时可以加快进化的脚步。因为如果突变不是灾难性的,那应该会带来更多的好处。
2型糖尿病具有更强的遗传倾向
近日,国际学术期刊Cell Reports 在线发表了中国科学院上海营养与健康研究所丁秋蓉研究组的研究成果“Gain-of-function mutations of SLC16A11 contribute to the pathogenesis of type 2 diabetes”。该研究发现SLC16A11基因编码区的2型糖尿病易感突变会产生功能获得性突变蛋白,导致肝脏脂滴不正常积累增多,进而导致2型糖尿病的发生。该研究结果对之前报道的认为此类易感突变导致蛋白功能缺失的研究结论提出了质疑。
人类遗传学研究,如全基因组关联分析(GWAS)研究,为发现新的疾病易感基因,深入理解疾病发生规律提供了一种大规模的、无偏见性的、有充分人群基础的研究角度。然而由于人群多样性和遗传信息的复杂性,GWAS研究往往只提示了特定遗传突变和特定疾病发生之间的显著相关性,而两者之间是否存在直接的因果关系几乎未知。因而,深入挖掘遗传信息如何导致疾病发生的分子机制对深刻理解疾病发生的遗传学基础显得尤为重要。
2014年,一项针对墨西哥和拉丁美洲人群的GWAS研究发现在SLC16A11基因编码区的5个连锁单核苷酸多态性(SNP)与2型糖尿病的发生存在显著相关性,其中4个SNP涉及SLC16A11蛋白的4个氨基酸位点突变(Williams,A.L., et al.Nature,2014)。SLC16A11属于一元羧酸转运通道蛋白,定位于内质网上,其转运底物和基本功能未知。
2017年,来自麻省理工和Broad研究所的Eric Lander研究组针对这个基因组区域2型糖尿病易感突变的功能进行了深入研究(Rusu,V.,et al. Cell.2017)。他们的研究发现部分SLC16A11定位于细胞质膜,运输底物为丙酮酸。而人群中发现的SLC16A11编码区突变导致SLC16A11功能缺失,无法正常定位质膜,影响丙酮酸运输,继而导致肝脏脂滴积累增加,促使2型糖尿病的发生;研究同时提出通过提高SLC16A11表达水平或活性来治疗2型糖尿病的潜在策略。但这项研究主要基于体外细胞过表达体系得到结论,缺乏体内生理状态下的直接证据。
为在生理状态下进一步研究SLC16A11编码区突变的生理学功能,该项目研究人员制作了Slc16a11敲除小鼠;并发现相对于野生型小鼠,敲除小鼠在正常饮食和高脂饮食喂养条件下并没有出现代谢表型上的差异,提示SLC16A11蛋白缺失并不会对代谢平衡造成显著影响。
研究人员进一步在Slc16a11敲除小鼠的基础上,通过腺相关病毒在肝脏组织里特异回补蛋白表达的方式研究了突变体SLC16A11对代谢平衡的影响。研究发现回补表达突变体SLC16A11的小鼠,相比回补表达野生型SLC16A11或空载体的小鼠,在高脂喂养情况下表现出血液和肝脏甘油三酯的明显增加,同时发生葡萄糖耐受性和胰岛素敏感性的明显下降,提示胰岛素抵抗的产生。进一步机制研究发现突变型SLC16A11能够显著提高肝脏细胞Lipin1表达,促进肝脏甘油三酯合成,进而影响2型糖尿病的发病过程。
该研究针对SLC16A11编码区2型糖尿病易感突变的作用机制提供了新的不同的阐释,对前期研究人员提出的通过提高SLC16A11表达水平或活性来治疗2型糖尿病的治疗策略提出了质疑。此类编码区易感突变导致SLC16A11获得何种额外功能,SLC16A11突变体如何促使Lipin1表达上调,其他分子机制是否参与介导肝脏甘油三酯过度积累等问题仍需进一步深入研究。
该研究工作得到营养与健康所研究员陈雁和应浩、香港中文大学教授吕爱兰、东莞理工大学教授马丹军的帮助。同时得到国家重点研发计划、中科院干细胞先导、国家自然科学基金委等的共同资助以及营养与健康所公共技术平台的支持。丁秋蓉为通讯作者,博士后赵永旭、博士研究生冯庄慧和研究助理张永贤为共同第一作者。
图注:研究发现SLC16A11编码区的2型糖尿病易感突变会产生功能获得性突变蛋白,导致肝脏Lipin1蛋白表达上调,脂滴不正常积累增多,进而导致2型糖尿病的发生。
研究发现2型糖尿病易感基因突变的致病机制,2型糖尿病具有更强的遗传倾向
四种DNA字母要编码20种氨基酸。绝不可能是一对一编码,也不可能是二对一编码,因为两个字母最多只能组成16种组合(4×4)。因此,最低要求是三个字母,也就是DNA序列里面最少要有三个字母对应到一个氨基酸,被称为三联密码,后来被克里克和西德尼·布伦纳证实。
但是这样看起来似乎很浪费,因为用四种字母组成三联密码,总共可以有64种组合(4×4×4),这样应该可以编码64个不同的氨基酸,那为什么只有20种氨基酸呢?一定有一个神奇的答案来解释为什么4种字母,3个一组,拼成64个单词,然后编码20种氨基酸。
1952年,沃森就曾写信告诉克里克:“DNA合成信使RNA(mRNA), mRNA合成蛋白质。”克里克开始研究这一小段mRNA的字母序列,如何翻译成蛋白质里面的氨基酸序列。他认为mRNA可能需要一系列“适配器”来帮助完成翻译,每一个适配器都负责携带一个氨基酸。当然每一个适配器一定也是RNA,而且都带有一段“反密码子”序列,这样才能和mRNA序列上的密码子配对。
适配器分子也由RNA分子组成。它们现在叫作“转运RNA”或tRNA。现在整个工程变得有点像乐高积木,一块块积木接上来又掉下去,一切顺利的话,它们就会这样一个接一个地搭成精彩万分的聚合物。
随着实验技术进步而且越来越精密,在20世纪60年代中期许多实验室陆续解开了序列密码。然而经过一连串不懈的译码工作后,大自然却好像随兴地给了个潦草结尾,让人既困惑又扫兴。遗传密码子的安排一点也不具创意,只不过“简并”了(意思就是说,冗余)。有三种氨基酸可对应六组密码子,其他的则各对应一到两组密码子。每组密码子都有意义,还有三组的意思是“在此停止”,剩下的每一组都对应一个氨基酸。这看起来既没规则也不美,根本就是“美是科学真理的指南”这句话的最佳反证。甚至,我们也找不出任何结构上的原因来解释密码排列,不同的氨基酸与其对应的密码之间似乎并没有任何物理或化学的关联。
克里克称这套让人失望的密码系统为“冻结的偶然”,而大部分人也只能点头同意。他说这个结果是冻结的,因为任何解冻(试图去改变密码对应的氨基酸)都会造成严重的后果。一个点突变也许只会改变几个氨基酸,而改变密码系统本身却会从上到下造成天大灾难。就好似前者只是一本书里无心的笔误,并不会改变整本书的意义,然而后者却将全部的字母转换成毫无意义的乱码。克里克说,密码一旦被刻印在石板上,任何想改动它的企图都会被处以死刑。这个观点至今仍有许多生物学家认同。
主题测试文章,只做测试使用。发布者:氨基酸肥料,转转请注明出处:https://www.028aohe.com/25674.html