БИОЛОГИЯ Том 3 - руководство по общей биологии - 2004

23. НЕПРЕРЫВНОСТЬ ЖИЗНИ

23.7. Природа генов

23.7.1. Что такое гены

В 1866 г. Мендель высказал предположение, что признаки организмов определяются наследуемыми единицами, которые он назвал «элементами». Позднее их стали называть генами, и было показано, что они расположены в хромосомах, которые передают их из поколения в поколение. Поэтому Мендель, вероятно, определил бы ген, как единицу наследственности. Это вполне приемлемое определение, однако оно ничего не говорит нам о физической природе гена.

Ниже мы попытаемся объяснить физическую природу гена, исходя из двух его определений.

ГЕН КАК ЕДИНИЦА РЕКОМБИНАЦИИ. Морган в своих работах по построению хромосомных карт Drosophila (разд. 24.2) постулировал, что ген — это самый короткий участок хромосомы, который может быть отделен от примыкающих к нему участков в результате кроссинговера. Согласно этому определению, ген представляет собой некий конкретный отрезок хромосомы, детерминирующий тот или иной признак организма.

ГЕН КАК ЕДИНИЦА ФУНКЦИИ. Поскольку известно, что гены определяют структурные, физиологические и биохимические признаки организма, было предложено определять ген, как наименьший участок хромосомы, обусловливающий синтез определенного продукта. Теперь мы знаем, что гены кодируют синтез белков. Поэтому ген можно определить, как участок ДНК, кодирующий определенный белок. Это определение можно еще больше уточнить, назвав ген участком ДНК, кодирующим определенный полипептид, поскольку некоторые белки состоят не из одной, а из нескольких полипептидных цепей, а поэтому кодируются более, чем одним геном.

23.7.2. Генетический код — это последовательность оснований

Когда Уотсон и Крик в 1953 г. заявили о спиральной структуре ДНК, они высказали также предположение, что генетическая информация, которая передается из поколения в поколение и контролирует жизнедеятельность клетки, заключена в молекуле ДНК в форме последовательности оснований. После того как было показано, что ДНК кодирует синтез белковых молекул, стало ясно, что последовательность оснований в ДНК должна кодировать последовательность аминокислот в белковых молекулах. Эта связь между основаниями и аминокислотами известна под названием генетического кода. В 1953 г. оставался ряд нерешенных проблем: необходимо было показать существование такого кода оснований, расшифровать его и установить, каким образом последовательность оснований в ДНК переводится в последовательность аминокислот в белковой молекуле.

23.7.3. Триплетный код

Молекула ДНК построена из оснований четырех типов: аденина (А), гуанина (Г), тимина (Т) и цитозина (Ц) (разд. 3.6) Каждое основание составляет часть нуклеотида, а нуклеотиды соединены в полинуклеотидную цепь; они обозначаются начальными буквами своих названий. И четыре буквы «алфавита» позволяют записывать инструкции для синтеза потенциально бесконечного числа различных белковых молекул. Существуют 20 аминокислот, из которых построены белки и которые должны кодироваться основаниями, входящими в состав ДНК. Если бы положение одной аминокислоты в первичной структуре какого-либо белка определяло одно основание, то этот белок мог бы содержать только четыре различные аминокислоты. Если бы каждая аминокислота кодировалась двумя основаниями, то с помощью такого кода можно было бы определить 16 аминокислот.

23.3. Составьте список 16 возможных попарных сочетаний из оснований А, Г, Т и Ц.

Включение в белковые молекулы всех 20 аминокислот может обеспечить только код, состоящий из трех оснований. Такой код может давать 64 сочетания оснований, что более чем достаточно. Поэтому Уотсон и Крик предсказали, что код должен быть триплетным.

23.4. Четыре основания, используемые по одному, позволяют закодировать четыре аминокислоты; используемые попарно - 16 аминокислот; используемые по три - 64 аминокислоты. Выведите математическое выражение, объясняющее это.

Позднее было доказано, что код действительно триплетный, т. е. что каждая аминокислота кодируется тремя основаниями.

Данные, свидетельствующие о триплетности кода

Такие данные были предоставлены Фрэнсисом Криком в 1961 г. Он получил у фага Т4 мутации, вызванные добавлением или выпадением оснований. Добавление или выпадение (делеция) какого-либо основания изменяет «прочтение» кода после точки, в которой произошло изменение (рис. 23.23). Возникшую в результате такого изменения мутацию называют мутацией со «сдвигом рамки считывания». Эта мутация не позволяет возникнуть таким последовательностям триплетов оснований, которые могли обеспечить синтез белковых молекул с прежней последовательностью аминокислот. К восстановлению первоначальной последовательности оснований могло бы привести только добавление одного основания или удаление одного основания в определенных точках. Такое восстановление предотвращало бы появление мутантов среди экспериментальных фагов Т4. Добавление одного основания получило название мутации типа (+), а удаление одного основания — мутации типа (—). Мутации типа (+) (—) восстанавливают правильное считывание. В двойных мутантах (++) или (——) также происходил сдвиг рамки считывания, что привело к появлению мутантов, синтезирующих дефектные белки. Однако, у мутантов (+++) или (———) никакого изменения синтеза белка не наблюдалось. По мнению Крика, это объясняется тем, что такие мутации не вызывают сдвигов рамки, а приводят лишь к добавлению или выпадению одной аминокислоты, что часто не оказывает воздействия на функции белка. Это означает, что код считывается сразу тремя основаниями, т. е. триплетами.

Рис. 23.23. Схема, поясняющая результаты удаления или добавления оснований в триплетном коде. Добавление основания Ц приводит к сдвигу рамки считывания, так что первоначальное сообщение ГАТ, ГАT... превращается в ТГА, ТГА... Выпадение основания А вызывает сдвиг рамки, приводящий к замене первоначального сообщения ГАT, ГАT... на АТГ, АТГ... Добавление основания Ц и удаление основания А в точках, указанных на схеме, приводят к восстановлению первоначального сообщения ГАT, ГАT... (По F. Н. С. Crick, The genetic code I, 1962, Scientific American Offprint, N 123, Wm. Saunders and Co.)

Эти эксперименты показали также, что триплеты не перекрываются, т. е. каждое основание принадлежит только одному триплету. Ни одно из оснований, входящих в данный триплет, не является частью соседнего триплета (рис. 23.24).

Рис. 23.24. Триплеты оснований в перекрывающемся и неперекрывающемся коде.

23.5. Используя повторяющиеся последовательности триплета ГТА и основание Ц, покажите, что исходную последовательность триплетов можно восстановить только путем добавления или удаления трех оснований. (Представьте свой ответ в такой форме, как показано на рис. 23.24.)

23.7.4. Расшифровка кода

После того, как была установлена триплетность кода, оставалось выяснить, какие триплеты кодируют каждую данную аминокислоту, иными словами — расшифровать код. Для того чтобы разобраться в использованных при этом экспериментальных процедурах, необходимо представлять себе в общих чертах механизм, с помощью которого триплетный код транслируется в белковую молекулу.

В синтезе белка участвуют нуклеиновые кислоты двух типов — дезоксирибонуклеиновая кислота (ДНК) и рибонуклеиновая кислота (РНК), взаимодействующие друг с другом. Существуют три главных типа РНК: информационная, или матричная, РНК (мРНК), рибосомная РНК (рРНК) и транспортная РНК (тРНК). Последовательность оснований ДНК переписывается (транскрибируется) в цепи матричной РНК, которая затем поступает из ядра в цитоплазму. Там эти цепи прикрепляются к рибосомам, и последовательность мРНК транслируется в последовательность аминокислот. Каждая аминокислота связывается с соответствующей тРНК, которая прикрепляется к комплементарному триплету оснований мРНК. Аминокислоты, оказавшиеся в результате этого друг подле друга, соединяются, образуя полипептидную цепь. Таким образом, для белкового синтеза необходимы ДНК, мРНК, рибосомы, тРНК, аминокислоты, АТФ как источник энергии, а также различные ферменты и кофакторы, катализирующие каждую стадию этого процесса.

Ниренберг использовал эти данные и различные методы, созданные в конце 50-х годов XX в., для разработки ряда экспериментов, поставленных с целью расшифровки кода. Суть его экспериментов сводилась к тому, чтобы, используя мРНК с заранее известной последовательностью оснований, выяснить последовательность аминокислот в полипептидной цепи, синтезируемой в присутствии этой мРНК. Ниренбергу удалось синтезировать мРНК, состоящую из многократно повторяющихся триплетов УУУ. Это соединение, названное полиуридиловой кислотой [поли(У)] было использовано в качестве кода. В каждую из 20 пробирок помещали бесклеточный экстракт Е. coli, содержавший рибосомы, тРНК, АТФ, ферменты и какую-либо одну меченую аминокислоту. Затем в каждую пробирку добавляли поли(У) и оставляли на некоторое время, чтобы произошел синтез полипептидов. Анализ содержимого пробирок показал, что полипептид образовался только в той пробирке, которая содержала аминокислоту фенилаланин. Это было первым шагом к расшифровке генетического кода. Ниренберг показал, что входящий в мРНК триплет оснований, или кодон, УУУ определяет положение в полипептидной цепи фенилаланина. Затем Ниренберг и его сотрудники занялись созданием синтетических молекул полинуклеотидов, соответствующих всем 64 возможным кодонам и к 1964 г. расшифровали коды для всех 20 аминокислот (табл. 23.4).

Таблица 23.4. Последовательность оснований в триплетном коде и кодируемые триплетами аминокислоты

Примечание. Приведены кодоны, т. е. последовательности оснований, в мРНК, а не в ДНК. Генетический код ДНК содержит комплементарные основания, а У заменен в нем на Т.

* Кодон, означающий конец синтеза полипептидной цепи; эквивалентен точке.

23.7.5. Характеристики генетического кода

Триплетность

Как уже было показано, генетический код — это триплетный код: три основания в молекуле ДНК кодируют одну аминокислоту в молекуле любого белка. ДНК-код сначала транскрибируется в матричную РНК, комплементарную этой ДНК. Комплементарные триплеты мРНК называют кодонами. Каждый кодон равен в длину трем основаниям и кодирует одну аминокислоту. ДНК-код для каждой аминокислоты можно получить, переведя кодоны РНК в комплементарные триплеты оснований ДНК в соответствии с табл. 23.5.

Таблица 23.5. Комплементарность между основаниями ДНК и РНК

Основания ДНК

Основания РНК

А (аденин)

У (урацил)

Г (гуанин)

Ц (цитозин)

Т (тимин)

А (аденин)

Ц (цитозин)

Г (гуанин)

23.6. Выпишите последовательность оснований в мРНК, образованной на цепи ДНК со следующей последовательностью:

АТГТТЦГАГТАЦЦГАТГТААЦГ

Код вырожденный

В табл. 23.4 приведены кодоны генетического кода. Как видно из таблицы, некоторые аминокислоты кодируются не одним, а несколькими кодонами. Такой код называют вырожденным. Анализ этого кода показывает также, что для многих аминокислот значение имеют, по-видимому, только две первые буквы кодона.

Код содержит знаки препинания

Среди кодонов, представленных в табл. 23.4, три служат «точками», т. е. обозначают окончание закодированного сообщения. Примером служит триплет УАА. Такие кодоны иногда называют «нонсенс-кодонами»; они не кодируют ни одну из аминокислот. По-видимому эти кодоны обозначают конец данного гена, т. е. служат «стоп-сигналами», прекращающими синтез полипептидных цепей во время трансляции.

Некоторые другие кодоны, такие как АУГ (метионин), служат «старт-сигналами», указывая на инициацию трансляции полипептидной цепи.

Код универсален

Одна из примечательных особенностей генетического кода состоит в том, что он, по-видимому, универсален. У всех живых организмов имеются одни и те же 20 аминокислот и одни и те же пять оснований (А, Г, Т, Ц и У).

В настоящее время успехи молекулярной биологии достигли такого уровня, что становится возможным определять последовательности оснований для целых генов и для целых организмов. Первым организмом, полный генетический код которого удалось расшифровать, был один из вирусов — фаг фХ174. У этого фага всего 10 генов, а его полный генетический код состоит из 5386 оснований. Последовательность этих оснований установил Фред Сенджер — исследователь, впервые открывший последовательность аминокислот в одном из белков. За каждое из этих фундаментальных открытий он получил по Нобелевской премии. Теперь стало возможным синтезировать целые гены, что находит применение в генной инженерии. Следует ожидать, что в самом начале XXI в. станет возможным в рамках проекта «Геном человека» расшифровать полный генетический код человека, длина которого, согласно оценкам, равна 3000 млн. пар оснований. (Геном — это вся ДНК данного организма.) В настоящее время ведутся работы по расшифровке геномов Е. coli, плодовой мухи (Drosophila), одной из нематод и лабораторной мыши.

Резюме

Ниже вкратце сформулированы основные черты генетического кода.

1. Кодом, определяющим включение аминокислот в полипептидную цепь, служит триплет оснований в полинуклеотидной цепи ДНК.

2. Код универсален: одни и те же триплеты кодируют одни и те же аминокислоты у всех организмов. (Несколько триплетных кодов митохондриальной ДНК и некоторых древних бактерий отличаются от универсального кода.)

3. Код вырожденный: данная аминокислота может кодироваться более чем одним триплетом.

4. Код неперекрывающийся: например, последовательность мРНК, начинающаяся с нуклеотидов АУГАГЦГЦА, не считывается как АУГ/УГА/ГАГ... (перекрывание по двум основаниям) или АУГ/ГАГ/ГЦГ... (перекрывание по одному основанию). (Однако перекрывание по нескольким генам обнаружено у некоторых организмов, например у бактериофага фХ174. Эти случаи, вероятно, очень редки и возможно объясняются экономией ДНК при очень малом числе генов.)