Основы биохимии Том 3 - А. Ленинджер 1985

Молекулярные механизмы передачи генетической информации
ДНК: структура хромосом и генов

Прежде чем приступить к изучению ДНК как хранилища генетической информации, полезно еще раз рассмотреть вопрос о природе информации. Мы уже видели, что информация характеризует степень упорядоченности системы и что в этом смысле она противоположна энтропии, которая характеризует степень беспорядка системы (см. дополнение 14-1); информацию иногда называют поэтому “отрицательной энтропией”. Таким образом, информация имеет отношение к энергии. Действительно, информацию можно измерить, т.е. оценить количественно, и связать ее с величинами энтропии и свободной энергии, однако это требует довольно сложного анализа с привлечением понятий вероятности и статистики.

Сегодня, в век электронных калькуляторов и компьютеров, всем известно, насколько они облегчают работу по хранению, переработке и поиску информации. На языке цифровых компьютеров единица информации называется битом (bit, сокращение от англ. слов binary digit — двоичный разряд). Один бит - это количество информации, необходимое для того, чтобы сделать правильный выбор между двумя альтернативными возможностями. Количество информации, требуемой для того, чтобы сделать два следующих друг за другом выбора между двумя альтернативными возможностями, равно двум битам. Аналогичным образом, для того, чтобы найти одну определенную карту среди 16 карт путем последовательных альтернативных (двоичных) выборов, необходимо четыре бита. Именно таким путем цифровой компьютер может преобразовывать информацию в виде длинного ряда двоичных выборов и как следствие этого составлять различного рода списки, готовить платежные ведомости и даже записывать симфонии.

Однако количество информации, заключенной в одной-единственной клетке человека, все еще намного превышает возможности доступных в настоящее время цифровых компьютеров: человек пока еще не способен выразить в цифрах все многообразие биохимических фактов и взаимосвязей. Двадцать аминокислот, из которых построены все белки, - это не просто двадцать кодирующих единиц, ибо значение любой данной аминокислоты в белке может быть различным. Например, значение серина может быть обусловлено тем, что в молекуле этой аминокислоты содержится полярная гидроксильная группа, способная образовывать водородную связь. Оно может быть также связано с тем, что серин входит в качестве важного структурного элемента в состав активного центра фермента (в случае трипсина) или регуляторного центра (в случае гликоген-фосфорилазы) или же быть носителем фосфатных групп (в казеине - белке молока). Перевести четырехбуквенный язык ДНК и двадцатибуквенный язык белков на язык цифр в том случае, когда эти буквы имеют множество значений, пока еще не представляется возможным.

Огромное количество информации, заложенной в ДНК, проще всего, пожалуй, проиллюстрировать, если вернуться на с. 850 к нуклеотидной последовательности ДНК маленького вируса фХ174, содержащей 5386 пар оснований, перечень которых занимает одну страницу очень мелкого текста. Чтобы напечатать нуклеотидную последовательность ДНК хромосомы Е. coli, содержащей 4 млн. пар оснований, потребовалось бы около 740 страниц этой книги. Полная же нуклеотидная последовательность ДНК 46 хромосом клетки человека заняла бы свыше 820 000 страниц, что соответствует 820 томам, каждый размером с весь наш трехтомный учебник. Но этот текст был бы бесполезен без полного знания принципов кодирования и программирования, лежащих в основе процессов транскрипции, трансляции и регуляции экспрессии генов; а это потребовало бы множества дополнительных томов информации.

Перейдем теперь к структуре ДНК, рассмотрим доказательства того, что именно в ДНК хранится генетическая информация, и постараемся понять природу основных функциональных единиц генетического материала - хромосом и генов.