遺伝暗号はどのように進化したのでしょうか?

次にコドンの最初の塩基にアデニンAが追加され、16種類のアミノ酸を生成できる(CAG)NS-原始遺伝暗号が誕生したと考えています。脂肪性のイソロイシンの他に、メチオニン、トレオニン、アスパラギン、セリンといった極性非電荷型側鎖(OH基、SH基、NH2基)をもつアミノ酸、リジンなど側鎖にNH3+をもつアミノ酸が生成できるようになりました。

最終的に、コドンの最初の塩基にウラシルUが追加され、20種類のアミノ酸を生成できる現在の普遍遺伝暗号が誕生しました。人間を初めとする地球上のすべての生物が生きていく上で必要なすべてのタンパク質をこの20種のアミノ酸だけで作り上げることができます。但しミトコンドリアや葉緑体などの細胞小器官では、非普遍遺伝暗号が使用されています。

こした遺伝暗号の進化を支持する証拠として、

1)第一塩基がGのコドンには、非普遍遺伝暗号が全く発見されていない。

2)非普遍遺伝暗号の数が、Cの段、Aの段、Uの段の順に多くなっている。

ことが挙げられます。つまり初期の遺伝暗号ほどより重要であるため、非普遍遺伝暗号が使用される頻度が少ないのです。

どうして4つのアミノ酸を基本的だと考えるのでしょうか?

[GADV]-アミノ酸は、いずれも原始地球上で容易に合成される簡単な構造を持ち、炭素隕石にも多く含まれています。この4つのアミノ酸はタンパク質の様々な二次構造を決める機能を有しています。グリシンはターン/コイル形成能の高いアミノ酸、アラニンはα‐へリックス形成能の高いアミノ酸、アスパラギン酸は化学反応を進めるカルボキシル基を持つ親水性アミノ酸、バリンはβ‐シート形成能の高い疎水性アミノ酸、という優れた性質があります。また4種のアミノ酸をランダムにつないでも、その表面に様々な触媒活性を持ち得る水溶性で球状のタンパク質を高い確率で形成できるからです。

その後、GNS原始遺伝暗号が現れたと考えています。コドンの最初の塩基は必ずグアニンGです。最後のSはGかCのいずれかを表しています。つまりGAGに対応するグルタミン酸が加わり、5種類のアミノ酸から、タンパク質が形成されたと考えられます。グルタミン酸が加わることで、得られるタンパク質の機能が高められたために、GNS原始遺伝暗号が定着したと考えられます。

次にコドンの最初の塩基にシトシンCが追加され、10種類のアミノ酸を生成できるSNS-原始遺伝暗号が誕生しました。ロイシンやプロリンなどの脂肪性アミノ酸の他に、中性アミノ基を側鎖にもつグルタミン(CAG)や、荷電性アミノ基を側鎖にもつヒスチジン(CAC)やアルギニン(CGC)が追加されました。

コンピュータシミュレ-ションで、SNS だけの繰り返し配列でもタンパク質の 6つの構造形成条件、(1)疎水性・親水性度、(2)α-へリックス形成能、(3)β-シート形成能、(4)ターン・コイル形成能、および、(5)酸性アミノ酸含量と(6)塩基性アミノ酸含量、を満足できることが確かめられています。現在の地球上に棲息しているGC含量の高い微生物はSNS遺伝暗号によってコードされる10種のアミノ酸を75%ほども使っています。太古の生物は、わずか10種のアミノ酸で極めて高い能力を発揮していたのではないかと考えられます。

どうして生物は20種類のアミノ酸を使っているのでしょうか?

タンパク質の機能を高めるために、遺伝暗号が進化し、現在の20種類のアミノ酸を生成する普遍遺伝暗号が誕生したと考えられます。アミノ酸はコドンと呼ばれる3つの塩基の組み合わせで決定されます。遺伝に用いられるRNAの塩基は、アデニンA、グアニンG、ウラシルU、シトシンCの4種類です。現在の遺伝暗号は普遍遺伝暗号をよばれ、コドン表が20種類のアミノ酸を規定しています。

池原健二教授は、過去の生物は、少数のアミノ酸からタンパク質を作り、生体を構成していたのではないかと考え、GADVタンパク質ワールド仮説を提唱しています。「GADV」とは、グリシン(G)、アラニン(A)、アスパラギン酸(D)、バリン(V)の4種類のアミノ酸のことです。これらのアミノ酸は、最初のコドンがグリシンGで始まります。つまりコドン表の一番下のGの段のアミノ酸が最古の生物を構成していたと考えています。太古代の生物は、現在と異なる原始的な遺伝暗号(コドン表)を持っていたことになります。最初のものはGNC原始遺伝暗号と呼ばれています。2番目のNはG,C,A,Uの4種類の塩基のいずれかを表しています。