Основы биоинформатики - Огурцов А.Н. 2013

Информационные принципы в биотехнологии
Анализ геномов
Состав геномов

Генетический код относительно высоко помехоустойчив. Поэтому, имея информацию о полных геномах, интересно исследовать эволюционную скорость мутаций, различая при этом синонимичные замены нуклеотидов - изменения в кодонах, которые не меняют кодируемую аминокислоту, и несинонимичные - которые приводят к мутациям в кодируемом белке (миссенс-мутации).

Имея две выровненные последовательности генов, мы можем рассчитать Ка - число несинонимичных замен и Ks - число синонимичных замен. Высокое значение отношения Ка/Ks свидетельствует о позитивном отборе, что связано, возможно, с изменением функции.

Сравнительная геномика с использованием секвенированых геномов позволяет исследовать следующие проблемы.

✵ Какие гены различают фенотип особей? Какие гены уникальны для каждого конкретного фенотипа особи? Варьирует ли их положение в геноме от особи к особи?

✵ Какие гомологичные белки различают фенотип особей? Какие белки уникальны для каждого конкретного фенотипа особи? Изменяется ли суммарное действие этих белков от особи к особи? Изменяются ли механизмы контроля нормальной экспрессии этих белков?

✵ Какие биохимические функции различают фенотип особей? Какие биохимические функции уникальны для каждого конкретного фенотипа особи? Изменяется ли суммарное действие этих биохимических функций от особи к особи? И если две особи имеют некоторую функцию и в одной есть ответственный за неё белок, а в другой — его гомолог, то несёт ли этот белок ту же функцию во втором организме?

В настоящее время общеприняты следующие главные функциональные классы белков:

✵ Энергетика клетки.

- Биосинтез кофакторов, аминокислот.

- Центральный и опосредованный метаболизм.

- Энергетический обмен.

- Жирные кислоты и фосфолипиды.

- Биосинтез нуклеотидов.

- Транспорт.

✵ Информация.

- Репликация.

- Транскрипция.

- Трансляция.

✵ Коммуникация и регуляция.

- Регуляторные функции.

- Клеточная оболочка/клеточная стенка.

- Клеточные процессы.

При сравнении наборов белков в трёх различных видах организмов Haemophilus influenzae (1680 генов) - представителя бактерий, Methanococcus jannaschii (1735 генов) - представителя архей, и Saccharomyces cerevisiae (дрожжи) (6278 генов) - представителя эукариот исследовалась проблема существуют ли в этих организмах общие белки для общих функций.

В классе энергетики клетки, белки, выполняющие энергетические функции, равномерно распределены по всем трём видам организмов. В классе коммуникации белки уникальны для каждого вида организма. В классе регуляции и информации архей имеют некоторые общие белки с бактериями, а другие общие белки - с эукариотами.

Сравнение геномов позволяет приступить к решению задачи создания так называемого "минимального организма», то есть организма с минимальным геномом, согласующимся с основной догмой молекулярной биологии ДНК→РНК→белок (то есть догмой, отрицающей существование безбелковых форм жизни, основанных исключительно на РНК). Минимальный организм должен обладать способностью к воспроизведению, но не обязательно должен конкурировать в способности роста и размножения с другими организмами. Можно предположить, что минимальный организм должен усваивать питательную среду, обеспечивая организму биосинтез, а также обеспечивать ответ на стресс, в том числе и восстановление повреждённой ДНК.

Гены, которые должен содержать такой минимальный организм называют операционными генами или генами "домашнего хозяйства" (housekeeping genes) - это гены, необходимые для поддержания важнейших жизненных функций организма, которые экспрессируются практически во всех тканях и клетках на относительно постоянном уровне. Гены домашнего хозяйства функционируют повсеместно, на всех стадиях жизненного цикла организма.

Анализ секвенированых геномов показал, что минимальный геном должен включать следующие функциональные классы генов.

✵ Трансляция и синтез белка.

✵ Репликация ДНК.

✵ Рекомбинация и репарация ДНК.

✵ Аппарат транскрипции.

✵ Белки-шапероны.

✵ Промежуточный метаболизм - гликолитический путь.

✵ Структуры, обеспечивающие трансмембранную транслокацию белков.

✵ Необходимый набор белков-транспортёров, обеспечивающих доставку недостающих метаболитов из окружающей среды.

Но до сих пор не доказано, что этот необходимый набор белков является достаточным для обеспечения жизнеспособности организма. Например, сравнение геномов эукариот и архей обнаружило только 71% гомологов из предложенного набора из 256 белков, и нет никаких оснований предполагать, что в оставшихся 29% нет генов, жизненно важных для жизнедеятельности минимального организма.

Тем не менее, определение функций является, безусловно, общим подходом при изучении всех форм жизни, что позволяет нам исследовать, до какой степени подобия различные организмы сформировали эти функции в процессе синхронной эволюции. Например, катализируют ли гомологичные белки из различных видов похожие реакции.

Анализ геномов выявил семейства гомологичных белков у архей, бактерий и эукариот.

Эволюционная биоинформатика позволяет начать проверку многих общепринятых на сегодняшний день гипотез.

Первой такой гипотезой является гипотеза о том, что семейства белков развились из индивидуального гена-предшественника в ходе видообразования и повторения событий.

Альтернативой этому может быть процесс горизонтального переноса генов - процесс, в котором организм передаёт генетический материал другому организму, не являющемуся ему потомком (в отличие от горизонтального, о вертикальном переносе генов говорят, если организм получает генетический материал от своего предка).

Сверхзадачей такого рода информационного анализа является составление карты-схемы общих функций и общих белков сравниваемых классов организмов, что и является предметом интенсивных исследований в области эволюционной биоинформатики в настоящее время.

Уже установлены несколько тысяч белковых семейств путём анализа гомологии с археями, бактериями и эукариотами. Разные виды содержат различное количество этих общих семейств: бактерии Aquifex amlicus - 83% белков имеют гомологов среди архей и эукариот, а Borrelia burgdorferi - только 52% белков имеют гомологов среди архей и эукариот. Геномы архей имеют немного больший процент белков (62-71%), гомологичных белкам бактерий и эукариот. Но только 35% белков дрожжей гомологичны белкам бактерий и архей.

Другой общепринятой гипотезой является гипотеза о том, что общий набор белков выполняет общий набор функций.

Среди белков минимального набора установленного из М. genitalium только около 30% имеют гомологии во всех известных геномах. Другие важные функции должны осуществляться при помощи неродственных белков или в некоторых случаях с применением неузнанных гомологов.

Общее число белковых семейств, в которых гомологи осуществляют общие функции в археях, бактериях и эукариотах, существенно увеличивается за счёт белков, осуществляющих процессы трансляции (таблица 18).

Таким образом, анализ эволюции белковых семейств в процессе приспособления белков к выполнению критически важных для жизнедеятельности организмов функций свидетельствует, что такие белки должны быть наиболее консервативными среди всего множества синтезируемых организмами белков.

Таблица 18 - Количество белковых семейств, характерных для всех известных геномов

Функциональные классы белков

Количество белковых семейств

Трансляция, включая структуру рибосом

53

Транскрипция

4

Репликация, рекомбинация, репарация

5

Базовый метаболизм

9

Клеточные процессы (шапероны, секреция, клеточное деление, формирование клеточной стенки)

9

Сравнение двух групп генов дрожжей - унаследованных от архейных и от эубактериальных предков - выявило, что по всем показателям гены архейных предков более значимы для жизнеобеспечения клеток дрожжей. Джеймс Коттон (James A. Cotton) и Джеймс Макинерни (James О. Mclnerney) доказали, что более высокая значимость архейных генов не зависит от их функций: и информационные гены (связанные с переносом информации от ДНК к белкам), и операционные гены (housekeeping genes) архейного происхождения более важны для клетки, чем гены эубактериального происхождения.

Была использована база данных делеций (или нокаута) генов дрожжей. В этой базе данных содержатся сведения о функциях генов, которые были выяснены путём отключения того или иного гена. Можно изъять ген из генома и посмотреть, смогут ли клетки без него обходиться. Если клетки без элиминированного гена умирают, то такая делеция будет летальной, если же будут нормально размножаться, то делеция считается нелетальной. Генетики разделили гены летальных и нелетальных делеций дрожжей на две группы - производные архейных и эубактериальных генов. Естественно, третью группу составили уникальные эукариотические гены, но не они интересовали исследователей.

Такая простая на первый взгляд группировка дала неожиданные результаты. Среди архейных генов у дрожжей оказалось в 2,5 раза больше летальных делеций, чем среди эубактериальных. Кроме того, экспрессия архейных генов интенсивнее эубактериальных больше чем вдвое.

Конечно, хорошо известно, что работа архейных и эубактериальных генов по существу различна.

Архейная группа генов по большей части занята работой с информацией - трансляцией, транскрипцией и репликацией генов, а эубактериальная группа отвечает за метаболизм клетки. Возможно ли, что различия в летальности делеций и уровне экспрессии связаны данной функциональной значимостью для жизнеспособности клетки? Если отключить один из метаболических каскадов - вполне возможно, клетка воспользуется имеющимся обходным путём или обойдётся без конечного продукта синтеза. Если же отключить одно из звеньев считывания информации, то клетка неминуемо погибнет.

Однако различия в летальности архейных и эубактериальных делеций не зависят от области "работы" гена. Те архейные гены, которые включены в метаболические каскады, также в среднем более детальны, чем эубактериальные коллеги, и наоборот, эубактериальные участники информационной деятельности менее важны для жизнеобеспечения, чем архейные представители.

Таким образом, стало ясно, что архейные гены в клетках дрожжей играют более важную роль, чем эубактериальные, несмотря на меньшее их численное представительство. Биография гена оказывается так же значима для объяснения его жизненной важности (летальности), связей с другими генами, уровня экспрессии и т. д., как и выполняемые им функции.

Эволюция вынуждена не только учитывать текущие нужды, порождаемые окружающей обстановкой, но и сохранять исторический груз прошлых приспособлений.

Клетки и организмы должны поддерживать линию жизни, которая тянется к ним от первых, первобытных клеток. Эволюция, ограничена необходимостью передачи полученных усовершенствований через потомство. После того, как критически важная часть оборудования доведена до совершенства и находится в постоянной эксплуатации, очень сложно удалить её, или заменить её, или пытаться модифицировать её, поскольку при этом существует очень большой риск разрушения всей системы, то есть гибели клетки.

Это в частности справедливо для таких ключевых молекулярных процессов, как

✵ считывание и использование генетической информации;

✵ производство необходимой в клетке энергии;

✵ размножение.

Каждый из этих процессов критически зависит от согласованной работы десятков и сотен молекулярных машин.

Это привело к выдающейся унификации, единообразию и подобию, в работе на молекулярном уровне таких ключевых процессов во всех биологических системах. Все они построены из подобных основных компонентов, открытых в своё время эволюцией и использующихся с тех пор во всех последующих организмах.