Биохимия - Химические реакции в живой клетке Том 3 - Д. Мецлер 1980

Биохимическая генетика и синтез нуклеиновых кислот и белков
Как возникла настоящая концепции
Генетический код

Предположение об общей природе генетического кода возникло из самой структуры ДНК. И ДНК, и белки представляют собой линейные полимеры. Отсюда казалось вполне логичным предположить, что последовательность оснований в ДНК. кодирует последовательность аминокислот. Но в ДНК содержатся всего лишь четыре типа оснований, тогда как в белках (в момент их синтеза) встречается двадцать различных аминокислот. Следовательно, каждая аминокислота должна детерминироваться сочетанием нескольких оснований. Шестнадцати возможных пар оснований также недостаточно для кодирования двадцати различных аминокислот. Таким образом, очевидно, что одной аминокислоте должен соответствовать по меньшей мере триплет, т. е. группа, состоящая из трех нуклеотидов [16]. Существует 64 (43) таких триплетных кодона (табл. 15-2 и 15-3).    

Таблица 15-2 Генетический кода

Аминокислота

Кодой

Общее число кодонов

Аланин

GCX

4

Аргинин

CGX, AGA, AGG

6

Аспарагин

AAU, AAC

2

Аспарагиновая кислота

GAU, GAC

2

Цистеин

UGU, UGC

2

Глутаминовая кислота

GAA, GAG

2

Глутамин

CAA, CAG


Глицин

GGX

4

Гистидин

CAU, CAG

2

Изолейцин

AUU, AUC, AUA

3

Лейцин

UUA, UUG, CUX

3

Лизин

AAA, AUG

2

Метионин (AUG является также кодоном инициации)

AUG

6

Фенилаланин

UUU, UUC

2

Пролин

CCX

4

Серин

UCX, AGU, AGC

6

Треонин

ACX

4

Триптофан

UGG

1

Тирозин

UAU, UAC

2

Валин (GUG иногда является кодоном инициации)

GUX

4

Терминация

UAA (ochre)

UAG (amber)

UGA

3

Общее количество


64

а Кодоны для каждой аминокислоты представлены в виде последовательности оснований в мРНК. Слева направо последовательность читается от 5'-конца к 3'-концу. Буква X обозначает любое из четырех оснований РНК. Таким образом каждый кодон, содержащий X, представляет собой на самом деле группу из четырех кодонов.

1) Эти цифровые данные не совсем точные. Так, при составлении карты, приведенной на рис. 15-1, принималось, что общая длина хромосомы составляет 4100 кв а мол. вес 2,7-109 [15].

Таблица 15-3 Шестьдесят четыре кодона генетического кода

5'-ОН-концевое основание


Основание в средней части

3'-ОН-концевое основание

U (T)

С

А

G

и(Т)

Phe

Ser

Tyr

Cys

U(T)

Phe

Ser

Tyr

Cys

c


Leu

Ser

Терминирующий кодон

Терминирующий кодон

А


Leu

Ser

Терминирующий кодон

Trp

G

с

Leu

Pro

His

Arg

U


Leu

Pro

His

Arg

C


Leu

Pro

Gin

Arg

А


Leu

Pro

Gin

Arg

G

А

Ile

Thr

Asn

Ser

U


Ile

Thr

Asn

Ser

C


Ile

Thr

Lуs

Arg

А


Meta

Thr

Lys

Arg

G

G

Val

Ala

Asp

Gly

U


Val

Ala

Asp

Gly

C


Val

Ala

Glu

Gly

А


Vala

Ala

Glu

Gly

G

а Кодоны инициации. Кодон метионина AUG является наиболее распространенным кодоном инициации. Однако GUG также может выступать в этой роли. В таких случаях он, как правило, соответствует не валину, а метионину.

Проще всего было представить, что последовательность аминокислот в белках однозначно определяется последовательными, неперекрывающимися триплетами. Но поскольку данных в пользу этого предположения первоначально не было, активно обсуждались другие возможности. Однако проведенные в течение нескольких лет генетические эксперименты (некоторые из которых приведены в разд. Г), а также рассмотренные в следующем разделе исследования чисто химического характера однозначно доказывают неперекрываемость кода.

Расшифровка кода

Даже после того как триплетная природа генетического кода стала очевидной, все еще оставалось много нерешенных вопросов. Используют ли клетки все 64 возможных кодона? Если да, то используются ли все они для кодирования аминокислот или же некоторые кодоны предназначены для других целей? Сколько кодонов определяют одну аминокислоту? «Универсален» ли код для всех организмов или же каждый организм использует свой код? Как можно расшифровать код? Несмотря на сложность всех этих вопросов, на каждый из них удалось получить однозначный ответ.

Важный эксперимент провели в 1961 г. Ниренберг1) и Маттеи [17].

1) В 1968 г. Ниренберг и Корана, а также Холли, которые первыми определили Нуклеотидную последовательность в транспортной РНК, были удостоены Нобелевской премии.

Используя обычный биохимический подход, Ниренберг выделял рибосомы из Е. coli и смешивал их с неочищенными экстрактами растворимых; веществ из тех же клеток Е. coli. В экстрактах содержались молекулы тРНК и ферменты, активирующие аминокислоты; в эту же систему были добавлены 20 аминокислот, АТР и ATP-генерирующая система (фосфоенолпируват+пируваткиназа). Ниренбергу удалось показать, что в этих условиях добавление РНК приводит к синтезу белка на рибосомах. В частности, очень эффективно стимулировала синтез белка РНК вируса табачной мозаики (гл. 4, разд. Г, 2). Решающую роль сыграли, однако, опыты (исходно поставленные просто в качестве «контроля»), в которых вместо мРНК добавлялся синтетический poly(U) (полинуклеотид, состоящий только из одних остатков уридиловой кислоты). Этот полинуклеотид представлял собой как бы синтетическую мРНК, состоящую из многократно повторяющегося кодона UUU. К удивлению Ниренберга, рибосомы «прочли» записанную в ней информацию и синтезировали пептид, состоящий только из фенилаланина. Таким образом, было установлено, что poly(U) вызывает синтез полифенилаланина и что триплет UUU является кодоном, детерминирующим фенилаланин. Итак, первый нуклеотидный триплет был идентифицирован! Используя этот же прием, удалось показать, что ССС служит кодоном для пролина, а ААА — для лизина. Изучение смешанных сополимеров, содержащих два разных нуклеотида, расположенных в случайной последовательности, позволило высказать предположение о значении других кодонов. Однако остальные кодоны удалось идентифицировать только спустя несколько лет, после того как Корана предложил методы синтеза олигонуклеотидов и полимеров с известной регулярно чередующейся последовательностью нуклеотидов.

К появлению нового метода привели данные о способности синтетических тринуклеотидов индуцировать связывание с рибосомами молекул специфических тРНК, «нагруженных» специфическими для них: аминокислотами [18, 19]. Так, например, тринуклеотиды UpUpU и АрАрА стимулировали связывание меченных иС фенилаланил-тРНК и лизил-тРНК соответственно. Вместе с тем соответствующие динуклеотиды не вызывали подобного эффекта. Эти данные не только позволили идентифицировать два кодона, но послужили также прямым доказательством триплетной природы генетического кода. Другой эффективный подход состоял в использовании синтетических РНК-полимеров, полученных сочетанием химических и ферментативных методов [20]. Полинуклеотид CUCUCUCUCU, например, вызывал в рибосомах синтез полипептида, состоящего из регулярно чередующихся остатков лейцина и серина.

В табл. 15-2 приведены известные теперь нам кодоны для каждой из 20 аминокислот. В табл. 15-3 те же 64 кодона расположены по-другому. Обратите внимание, что помимо кодонов, детерминирующих специфические аминокислоты, есть три кодона, а именно UAA, UAG и UGA, получившие название терминирующих кодонов. Их часто называют также nonsense-кодонами, т. е. бессмысленными кодонами. Терминирующие кодоны UAA и UAG называют соответственно также ochre (охра)- и amber (амбер)-кодонами1) [21]. Было обнаружено, что кодоны AUG(метионин) и значительно реже GUG (валин) играют роль инициирующих кодонов в процессе синтеза белка у бактерий. Таким образом, N-концевой аминокислотой во вновь синтезируемых белках у бактерий чаше всего бывает метионин, точнее N-формилметионин. N-формилметионин-тРНК специфически связывается с участками инициации, содержащими AUG-кодон в мРНК-рибосомном комплексе. Подробно этот процесс описан в разд. Б.

1) Происхождение этих терминов объясняется тем, что «всегда безопаснее дать, новому открытию ничего не значащее название, чем спекулятивно описательное». Термин amber был предложен для класса мутаций, открытых с участием студента-старшекурсника по фамилии Бернштейн (Bernstein), что в переводе означает янтарь (по английски — amber) [21].

Результаты многочисленных исследований свидетельствуют о том, что генетический код, установленный для Е. coli, является универсальным. Так, например, в лабораториях Уитмана и Френкель-Конрата препарат РНК, экстрагированный из вируса табачной мозаики, обработали азотистой кислотой; известно, что при этом происходит дезаминирование многих остатков цитозина с образованием урациловых остатков, в результате чего кодоны UCU (серин) превращаются в UUU (фенилаланин). Аналогичным путем из кодона ССС (пролин) может образоваться CUC (лейцин). Оказалось, что при заражении растений табака препаратом РНК, обработанной азотистой кислотой, аминокислотная последовательность вирусного белка оболочки, выделенного из мутантных штаммов, действительно меняется [22]. Причем многие из происшедших изменений можно было точно предсказать исходя из данных, приведенных в табл. 15-3. Сходным образом, замены аминокислот в дефектных молекулах гемоглобина (рис. 4-17) в большинстве случаев могут быть обусловлены изменением только одного основания. Так, гемоглобин S может образовываться в результате одного из следующих изменений в седьмом кодоне: GAA(Glu)→GUA(Val) или GAG(Glu)→GUG (Val). Еще один аргумент в пользу универсальности генетического кода состоит в способности рибосом и молекул тРНК из Е.соli осуществлять трансляцию цепи мРНК, кодирующей синтез гемоглобина, и синтезировать при этом полноценный гемоглобин [23].