遗传密码
破解历史
遗传密码
自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫指出需要以三个核酸一组才能为20个氨基酸编码。1961年,美国国家卫生院的J. Heinrich Matthaei与马歇尔·沃伦·尼伦伯格在 无细胞系统 ( 英语 : Cell-free system ) 环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU ->Phe)哈尔·葛宾·科拉纳科拉纳破解了其它密码子罗伯特·W·霍利·霍利发现转录责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖。
基因组的表达
一个生物体携带的遗传信息-即基因组-被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一连串单核苷酸组成。每个单核苷酸均由碱基,戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。堿基不同构成了不同的单核苷酸。组成DNA的堿基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的堿基以尿嘧啶(U)代替了胸腺嘧啶(T)。三个单核苷酸形成一组 密码子 ,而每个密码子代表一个氨基酸或停止讯号。
制造蛋白质的过程中,基因先被从DNA转录为对应的RNA范本,即信使RNA(mRNA)。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下,由该RNA范本转译成为氨基酸组成的链(多肽),然后经过转译后修饰形成蛋白质。详情参阅 转译 。
因为密码子由三个核苷酸组成,故一共有4 =64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。
标准遗传密码如下表所示:由3个碱基对应到氨基酸的密码子表以及由氨基酸对应到3个碱基的反密码子表。
密码子表
RNA密码子表
DNA密码子表
DNA密码子表与RNA密码子表基本相同,除了使用T来替代U。
技术细节
起始和终止密码子
蛋白质的转译从初始化密码子( 起始密码子 ( 英语 : Start codon ) )开始,但亦需要适当的初始化序列和起始因数才能使mRNA和核糖体结合。最常见的起始密码子为AUG,其同时编码的氨基酸在细菌为甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在个别情况其它一些密码子也具有起始的功能。
在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因数结合,使多肽从核糖体分离而结束转译的程式。另外,在哺乳动物的线粒体中,AGA和AGG也充当终止密码子。
密码子简并性
更多资料::en:Codon degeneracy
大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位元堿基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位元为哪种核苷酸,都编码同一种氨基酸,则称之为 四重简并密码子 (fourfold degenerate codons);如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为 二重简并密码子 (twofold degenerate codons),一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。
遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位元的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变 (英语) 。
简并性的出现是由于tRNA反密码子的第一位堿基可以和mRNA构成摆动堿基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。
另一种有助对抗点突变的情况,是NUN(N代表任何核苷酸)倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。
阅读框
“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个 阅读框 ,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。 实际的框架是由 起始密码子 ( 英语 : Start codon ) 确定,通常是mRNA序列上第一个出现的AUG。
破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。
非标准的遗传密码
虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨酰胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些酵母会把GUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。
真菌、原生生物和人以及其它动物的线粒体中的遗传密码与标准遗传密码的差异,主要变化如下:
按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱氨酸和UAG转译为吡咯赖氨酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
相关资料
展开- 有价值
- 一般般
- 没价值