Биохимия и молекулярная биология - Белясова Н.А. 2002

Молекулярные основы и механизмы наследственности
Организация генетического аппарата клетки
Генетический код

Первые представления о том, каким образом в генах закодирована на­следственная информация, изложил Ф. Крик в своей «гипотезе последова­тельности», согласно которой последовательность аминокислот в полипеп­тидной цепи определяется последовательностью элементов в гене. Экспери­ментальные подтверждения данная гипотеза получила уже после расшифров­ки генетического кода в экспериментах Ч. Яновского. Чарльз Яновский в 1964 г. показал совпадение относительного положения индуцированных му­таций в гене trpA E.coli и аминокислотных замен в кодируемом этим геном ферменте — триптофан-синтетазе. Таким образом, была доказана колинеарность структуры гена и кодируемого им полипептида.

Тем не менее молекулярные основы этой колинеарности были вовсе не очевидны, поскольку все разнообразие аминокислот в полипептидах описы­вается значением 20, а разнообразие нуклеотидов в ДНК —значением 4. Та­ким образом, один нуклеотид никак не может кодировать одну аминокислоту в пептиде.

Эксперименты Ф. Крика и его соавторов по исследованию мутаций у бактериофага Т4 кишечной палочки позволили прийти к заключению, что каж­дая аминокислота кодируется тремя нуклеотидами, т. е. генетический код триплетный. Этот вывод следовал из наблюдения, что мутации, сопровож­дающиеся вставками или выпадениями (делециями) одного либо двух нук­леотидов из генома Т4, приводили к образованию аномальных белков с на­рушенной функцией. Наоборот, вставки или делеции трех нуклеотидов сопро­вождались часто незначительными изменениями в составе белков, в резуль­тате чего последние сохраняли активность. Крик и Бреннер заключили, что генетический код считывается дискретными единицами по 3 нуклеотида. В таком случае вставка (делеция) триплета нуклеотидов должна приводить к добавлению (изъятию) всего одной аминокислоты из состава соответствую­щего полипептида. В ситуации, когда вставка (делеция) нуклеотидов совер­шается в количестве, не кратном трем, должен происходить сдвиг «рамки считывания» и последовательность аминокислот в белке должна полностью меняться.

Таким образом, генетический код — триплетный, т. е. положение каждой аминокислоты в полипептиде задается последовательностью из трех нуклео­тидов, которая носит название кодон. Поскольку число разных нуклеотидов в ДНК равно четырем, то количество возможных вариантов триплетов нуклео­тидов будет описываться количеством: 4 ґ 4 ґ 4 = 64. 61 из 64 триплетов кодируют аминокислоты, причем каждый триплет — только одну аминокис­лоту, а три оставшихся кодона служат сигналами окончания (терминации) трансляции (рис. 1.7). Эти кодоны называют стоп (stоp)-кодонами или нон­сенс-кодонами, поскольку они не определяют никакой аминокислоты. По­мимо этого, два кодирующих триплета (чаще ATG — для Met, иногда GTG — для Val) выполняют двойную функцию: кодируют аминокислоты ме­тионин или валин и служат стартовыми кодонами, на которых начинается процесс трансляции (рис. 1.7).

Рис. 1.7. Структура генетического кода. Подчеркнуты кодоны, выполняющие функции стартовых при трансляции. Выделены стоп-кодоны, терминирующие процесс трансляции

Особенностью генетического кода является то, что в нем отсутствуют за­пятые, т. е. нет знаков, отделяющих один кодон от другого. При этом генетический код не перекрывается в пределах одной рамки считывания, а рамка считывания задается первым «читаемым» нуклеотидом (рис. 1.8). Макси­мальное количество рамок считывания в гене — 3, столько же, сколько и «букв» в коде.

Для большинства клеточных организмов характерна реализация лишь од­ной рамки считывания, в то время как у некоторых вирусов их может быть две или даже три.

Направление чтения закодированной записи осуществляется от 5'-конца к 3'-концу мРНК, являющейся транскриптом «+»-цепи ДНК, считанным с нее в направлении 5' → 3'. Первый с 5'-конца кодон отвечает N-концевой амино­кислоте полипептидной цепи. Следовательно, белки синтезируются от N- конца к С-концу (рис. 1.8).

Еще одним свойством генетического кода является его вырожденность. Это означает, что одна аминокислота может кодироваться более чем одним триплетом нуклеотидов. С другой стороны, код не является двусмысленным: каждый кодон кодирует только одну аминокислоту. Такая закономерность выражается в том, что если известна последовательность нуклеотидов в ДНК, то с ее помощью легко узнать последовательность аминокислот в белке; на­оборот, известную последовательность аминокислот нельзя однозначно пере­вести в нуклеотидную последовательность ДНК. Вырожденность генетиче­ского кода, как правило, приводит к тому, что у кодонов, определяющих одну и ту же аминокислоту, реально распознаются только первые два нуклеотида, а третий может не иметь значения.

Рис. 1.8. Рамки считывания генетического кода. Цифрой «1» обозначены пер­вые нуклеотиды, задающие каждую из трех возможных рамок считывания. Полипептид строится от N-конца (свободная аминогруппа) к С-концу (свобод­ная карбоксильная группа). Сдвиг рамки считывания приводит к изменению последовательности аминокислот в пептидной молекуле

Для объяснения этого феномена Крик предложил гипотезу «качания» (от англ. wobble), которая впоследствии подтвердилась, и в настоящее время называется правилом неоднозначного соответствия. Согласно этому правилу, соответствие третьего нуклеотида в кодоне мРНК первому нуклеотиду в анти­кодоне тРНК является нестрогим, поскольку часто первое положение в анти­кодоне тРНК занимает минорный нуклеотид, содержащий в качестве азоти­стого основания инозин. Инозин может образовывать водородные связи с урацилом, цитозином или аденином, находящимися в кодоне в третьем поло­жении. Существование такого механизма позволяет клетке иметь меньше 61 разной тРНК, поскольку многие тРНК способны узнавать до трех кодонов.

Генетический код универсален. Это свойство кода состоит в том, что лю­бая молекула мРНК при трансляции в клетке любого организма приведет к синтезу полипептида с одинаковой последовательностью аминокислот. Дан­ное правило, однако, имеет исключения, которые касаются генетического кода ДНК митохондрий. Большей частью и здесь используется основной «ге­нетический словарь», но, например, в митохондриях млекопитающих кодон UGA в мРНК «читается» как триптофан, и в пептид в соответствующее поло­жение включается триптофан, в то время как в ядерной мРНК данный кодон служит стоп-кодоном (рис. 1.7) и на нем заканчивается процесс трансляции. Наоборот, в митохондриях млекопитающих триплеты нуклеотидов AGA и AGG прочитываются как сигналы терминации, а в ядре они кодируют амино­кислоту аргинин. В митохондриях других организмов могут встречаться иные отклонения от универсального для ядерной ДНК генетического кода.

Структура триплетов нуклеотидов коррелирует с химическими свойства­ми кодируемых ими аминокислот. Так, все кодоны с уридилатом во втором положении кодируют аминокислоты с гидрофобной боковой цепью: фенила­ланин, лейцин, изолейцин, валин, метионин. Если исключить терминирую­щие кодоны, то наличие аденилата во втором положении определяет поляр­ную или заряженную боковую цепь (тирозин, гистидин, глютамин, аспарагин, лизин, глютаминовая и аспарагиновая кислоты. К тому же кодоны для боль­шинства гидрофобных аминокислот различаются только одним нуклеотидом (рис. 1.7). Аналогичная ситуация наблюдается и для кодонов серина и трео­нина (их боковые группы содержат гидроксил) или аланина и глицина (имеют наименее сложно устроенные боковые группы). Таким образом, генетический код устроен так, что при замене нуклеотидов даже в первой или второй пози­ции некоторых кодонов в полипептид включается структурно родственная аминокислота, сводя тем самым к минимуму нарушения во вторичной струк­туре белка.

Расшифровка генетического кода осуществлена Ниренбергом и Кораной в начале 60-х годов прошлого столетия. В ходе первых экспериментов в бес­клеточную систему для синтеза белка, содержащую все необходимые компо­ненты, в качестве мРНК вносили искусственно синтезированные гомополи­нуклеотиды: полиуридилат, полицитидилат и др. Синтезированные в таких условиях полипептиды подвергали аминокислотному анализу и установили, что на мРНК, представляющей собой poly(U) (т. е. UUUUUU...), синтезирует­ся полифенилаланин, на poly(C) — полипролин и т. д. Таким образом, можно было заключить, что триплет нуклеотидов UUU кодирует аминокислоту фе­нилаланин, а ССС — пролин. Окончательную расшифровку всех 64 кодонов удалось осуществить с использованием в бесклеточных системах трансляции синтетических полирибонуклеотидов с известными повторяющимися после­довательностями. Эти регулярные сополимеры удалось получить благодаря комбинированию методов органического и ферментативного синтеза.