Пептидная саморегуляция живых систем (факты и гипотезы) - Шатаева Л. К. 2003

Пептиды в водных растворах
Регуляторные пептиды как носители молекулярной информации
Информационная нагрузка аминокислотных последовательностей РП

При рассмотрении механизмов саморегуляции организма особый интерес представляют сигнальные функции его компонентов. Как писал И. И. Шмальгаузен, “связи между организмом и средой не ограничиваются явлениями обмена веществ и энергий. Большое значение имеет восприятие сигналов, которые не имеют непосредственного значения в обмене веществ, но определяют поведение организма” (Шмальгаузен, 1968. С. 268).

Первичный уровень связи живой системы с внешней средой основан на изменениях тех параметров внешней среды, которые можно назвать энергетическими: температуры, давления, кислотности среды, потока трофических веществ. Восприятие этих изменений обусловлено чувствительностью соответствующих клеточных рецепторов: изменением их конформации, гидратации, степени диссоциации ионогенных групп, а также смещением равновесий метаболических реакций в клетке. Это первичный, или энергетический, уровень взаимодействия живой системы с внешней средой.

Вторичный уровень связи организма со средой ориентирован на изменения порядка во внешней среде: это восприятие энергетически постоянных параметров внешней среды при изменении их ориентации (направления), длительности или последовательности. Мы замечаем не только высоту и интенсивность звуков (энергетический уровень), но и изменение их ритма (вырожденность) или изменение чередования одних и тех же звуков. Такое восприятие (его называют информационным) не является энергетическим — это восприятие изменения энтропии во внешней среде на фоне постоянного энергетического взаимодействия со средой. По мере усложнения живой системы и ее связей с внешним окружением метаболические потоки дополняются информационными.

Особенность жизни как термодинамического феномена заключается в том, что открытая живая система воспринимает изменение порядка в окружающей среде (т. е. поток информации) и соответственно меняет свои внутренние параметры (программу поведения) для самосохранения. Иначе говоря, живой системе присущи не только метаболизм и самовоспроизведение, но и восприятие потока информации, необходимой для саморегуляции.

Формы упорядоченности окружающей среды разнообразны. В силу определенных причин и законов неживой природы из бесконечного числа одновременно сосуществующих частиц, колебаний и волн формируется узкая полоса частот с повышенной интенсивностью. Например, на фоне рваных серо-синих туч и голубого неба возникает семицветная радуга (иногда две) со строгой последовательностью интервалов длин волн электромагнитных колебаний. Для визуального восприятия радуги требуется только одно — чтобы у реципиента было цветовое зрение. Аналогичный принцип лежит в основе формирования музыкальных звуков в природе. Эолова арфа, например, выделяет в сплошном шуме ветра одну резонансную частоту звуковых колебаний, усиливает их, и человек слышит определенную музыкальную ноту. Это примеры восприятия упорядоченности на фоне “шума” распространяющихся звуковых или электромагнитных волн. Энергетическая составляющая этих колебаний важна только для преодоления порога чувствительности воспринимающего органа.

На уровне энергетических взаимодействий регуляторные функции, строго говоря, свойственны всем веществам, участвующим в метаболизме клетки. Концентрации ионов водорода и аммония, ионов металлов, а также аминокислот и их производных обеспечивают потенцирование или ингибирование биохимических реакций как участники или продукты этих реакций. (Кричевская и др., 1983). Можно сказать, что биохимическая регуляция лежит в диапазоне концентраций компонентов 10-2—10-7 М.

На молекулярном уровне соотношение энергетической и информационной составляющих взаимодействия зависит от уровня организации системы. По-видимому, среди компонентов живых систем самый высокий уровень молекулярной организации достигнут у полипептидов, что позволяет им выступать в роли индукторов и реципиентов молекулярной информации. Отдельные фрагменты полипептидов (регуляторные пептиды) могут служить носителями молекулярной информации.

Биологическая активность регуляторных пептидов рассматривается обычно с двух точек зрения: с точки зрения фармакокинетики, изучающей продолжительность их действия в организме, и с точки зрения фармакологии, изучающей взаимосвязь дозы вещества (обычно отнесенной к единице массы тела подопытного животного) с наблюдаемым эффектом. При этом используется шкала молярных концентраций, позволяющая сравнивать действие пептидов, имеющих разную молекулярную массу. Диапазон активных концентраций может служить критерием трофических или информационных функций пептида.

Одна из особенностей пептидной регуляции состоит в том, что она наблюдается при очень низких концентрациях (порядка 10-18—10-12 М), при которых непосредственное участие пептидов в реакциях биосинтеза не может быть существенным (Ашмарин, Каменская, 1988; Ашмарин и др., 1992; Сазанов, Зайцев, 1992). С этой точки зрения эффективная доза пептида Lys—Pro, равная 10-4 моль на 1 мышь и влияющая на регенерацию тканей (Kohl et al., 1989), является скорее трофической, чем сигнальной. В то же время синтетические пептиды, влияющие на экспрессию рецепторов тимоцитов в концентрациях порядка 10-13—10-14 М, можно считать сигнальными (Хавинсон, Жуков, 1992).

Цитологические эксперименты и клинические наблюдения свидетельствуют о том, что препараты класса цитомединов также содержат именно информационные тканеспецифические олигопептиды, поскольку в диапазоне их эффективных концентраций (10-10—10-12 М) они, по-видимому, не имеют трофического значения (Морозов, Хавинсон, 1983; Хавинсон, Жуков, 1992; Кузник и др., 1999).

Химические сигналы, передаваемые аминокислотами или простыми нейромедиаторами, независимо от концентрации имеют очень краткую длительность. Напрашивается аналогия с более высоко организованными системами коммуникации: нейромедиаторы, подобно устной речи, являются моментальными сигналами, так как они “звучат” очень недолго. По мере удлинения пептидной цепочки увеличиваются устойчивость и время жизни сигнала. Информация, записанная последовательностью аминокислотных остатков, подобно письменному сообщению, сохраняется дольше во времени и может диффундировать на более удаленные расстояния в пространстве (Ашмарин, Каразеева, 1999).

Как правило, аминокислотную последовательность пептида, для которого уже установлена определенная регулирующая или модулирующая функция, можно обнаружить в составе одного или нескольких значительно более крупных белков. Этот установленный факт имеет несколько интерпретаций. С одной стороны, существует теория И. П. Ашмарина о непрерывном функциональном спектре РП, которые происходят из общих предшественников (например, проопиомеланокортин и препротахикинин) путем их поэтапного расщепления на более мелкие фрагменты. Сам по себе предшественник никакой специальной активности не проявляет, но его фрагменты выполняют различные регуляторные функции, в том числе нейромедиаторные и нейрогормональные (Ашмарин, Обухова, 1986; Ашмарин, Каменская, 1988).

С другой стороны, известна гипотеза В. Т. Иванова о существовании специфического пептидного пула (фонда), который происходит из функционально активных высокомолекулярных белков путем тканеспецифического ферментного гидролиза этих белков до пептидов определенного размера (Иванов и др., 1997). В частности, исследование продуктов гидролиза гемоглобина и пептидов, содержащихся в питательной среде при культивировании человеческих эритроцитов, показало, что определенные отрезки цепей а- и ß-глобинов проявляют биологическую активность, не свойственную исходному гемоглобину: они связываются с опиатными рецепторами, ингибируют глюкозо-6-фосфат-изомеразу, ингибируют ангиотензин-преобразующие ферменты, потенцируют действие брадикинина. Некоторые из этих пептидов, названные геморфинами, были обнаружены в мозжечке, гипофизе и спинномозговой жидкости человека, в мозгу быка и гипоталамусе свиньи. Авторы этих исследований указали на сходство геморфинов с пептидами класса цитомединов. Эта точка зрения нашла подтверждение в работах Р. В. Петрова, посвященных выделению регуляторных пептидов из супернатанта культуры клеток костного мозга — миелопептидов. Два пептида — МП-1 и МП-2 оказались идентичны консервативным фрагментам а- и ß-цепей гемоглобина (Петров и др., 2000).

Обе упомянутые концепции опираются на представление о специфическом и определенным образом запрограммированном расщеплении высокомолекулярных белков-пред шественников на короткие пептиды, выполняющие сигнальные функции в поддержании тканевого гомеостаза (Янковский, Довнар, 1986).

Аналогичные представления лежат в основе поиска РП среди фрагментов пищевых белков, но при этом характер воздействия пептида на функции клетки остается неопределенным (Yamamoto, 1997).

Однако эти гипотезы о происхождении регуляторных олигопептидов не определяют механизмов регуляторного воздействия олигопептида на функции клетки. Хотя есть примеры и обратной связи низкомолекулярных и высокомолекулярных гормонов (регуляторных пептидов). В частности, в гипоталамусе синтезируется прогормон, который содержит шесть повторов последовательности Glu—His—Pro, из которого в результате гидролиза формируется гормон тиролиберин: pyroGlu—His—ProNH2. Низкомолекулярный тиролиберин в свою очередь регулирует синтез в аденогипофизе гормона тиротропина, полипептида с молекулярной массой 28 300 Да (Oxford Dictionary..., 1997). По-видимому, именно участие олигопептидов в инициировании процесса транскрипции высокомолекулярных пептидов обеспечивает саморегуляцию процессов белкового синтеза.

При исследовании регуляторных свойств компонентов, выделенных из различных тканевых экстрактов, нами была выдвинута “концепция о существовании в организме цитомединов, представляющих собой одну из групп информационных молекул, которые участвуют в поддержании структурного и функционального гомеостаза клеточных популяций” (Морозов, Хавинсон, 1996).

Обычный подход к отысканию информационного сайта в структуре белка состоит в использовании иммуноспецифических (RIA или FIA) методов. Так, например, был определен участок аминокислотной В1-цепи ламинина, ответственный за адгезию эпителиальных клеток, — нонапептид CDPGYIGSR. Дальнейшие исследования показали, что этот пептид может быть укорочен до YIGSR с полным сохранением аффинного связывания с рецептором ламинина и влияния на адгезию клеток; но исключение Y или R резко снижает специфическую активность. Именно указанный пентапептид является сигналом для осуществления адгезии эпителиальных клеток (Graf et al., 1987).

Кроме эмпирического поиска информационно значимых участков пептидной цепи в настоящее время развивается и теоретический подход к этой проблеме — статистический анализ последовательности элементов в цепях ДНК и полипептидах (Herzei et al., 1994; Atchley et al., 2000; Weiss et al, 2000). Этот подход позволяет оценить устойчивые последовательности аминокислот (консервативные блоки) в определенном белке и рассчитать конфигурационную энтропию его цепи. Опираясь на теорию эндогенного происхождения РП в результате поэтапного гидролиза белковых предшественников, можно предполагать, что именно эти блоки могут проявлять регуляторную активность.

Статистический подход к исследованию аминокислотной последовательности существенно отличается от статистической механики теории газов. В отличие от молекул газа, которые могут свободно меняться местами в пространстве, элементы полипептидной цепочки не могут быть переставлены произвольно. Фиксированное расположение аминокислотных остатков вдоль цепи соответствует определенному порядку, и мерой этого порядка является энтропия последовательности. Если пептид состоит только из остатков одной аминокислоты (гомополимер), то вероятность найти этот аминокислотный остаток на любом месте в цепочке равна 1, а энтропия последовательности цепи равна 0, т. е. минимальна. Эту статистическую определенность расположения остатка в цепи не следует путать с определенностью конфигурации цепи.

В термодинамике полимеров (в том числе полипептидов) при статистических расчетах используется понятие “конфигурационная энтропия”, возникшее из представления о поворотной изомерии полимеров (Волькенштейн, 1981). Энергия в синтетическом или природном полимере распределяется не по звеньям (мономерам), а по отрезкам цепи, подвижность которых ограничена точками поворота. Чем больше пространственных конфигураций цепи полимера может осуществиться в результате вращения элементов цепи, тем больше у него степеней свободы и тем выше его энтропия. Как уже упоминалось в разделе 1.2.3, конформационная энтропия полипептидной цепи пропорциональна ее длине и увеличивается из-за разнообразия ее боковых групп и их поворотов. Любая пространственная фиксация определенной конфигурации цепи, которая осуществляется в полипептидах за счет кооперативных внутримолекулярных связей, уменьшает число доступных энергетических состояний и приводит к следующему уровню структурной организации макромолекулы: возникают а- или ß-конформации цепи (вторичная структура).

Мы не будем рассматривать конформационную упорядоченность пептидных цепей, а ограничимся рассмотрением последовательности аминокислотных остатков, которая фиксирована ковалентными связями. Тем более что какую бы пространственную конфигурацию ни принимала пептидная цепь, последовательность аминокислот в ней (одномерная первичная структура) остается постоянной.

В состав пептидных цепей входит 20 различных аминокислотных остатков. Их расположение друг за другом вдоль цепи может быть случайным (беспорядочным), и в этом случае энтропия такой последовательности будет максимальна. Как показывают табл. 6 и 7, аминокислоты различаются по востребованности в РП и соответственно образуют повторяющиеся блоки в составе их цепей. Можно предполагать, что эти блоки являются источниками определенных молекулярных сигналов, имеющих информационное значение, так как их состав различается в пептидах, относящихся к регуляции различных физиологических функций.

Как отмечал один из основоположников теории информации Р. Хартли, в обычном понимании термин “информация” слишком эластичен и для каждой области исследования необходимо установить его специфический смысл (Hartley, 1928). Так как в дальнейшем мы столкнемся с проблемой количественного измерения информации, целесообразно уточнить некоторые термины, которые были включены в область молекулярной биологии из областей математической статистики и теории связи.

При исследовании молекулярных систем понятие информации совершенно естественно связано с понятием энтропии. Энтропия является количественной характеристикой хаотичности, разупорядоченности системы; информация характеризует упорядоченность и детерминированность системы, которая необходима для ее воспроизведения. Принято считать, что информация равна энтропии с обратным знаком (Бриллюэн, 1966).

Как известно, собственно задача измерения информации возникла при разработке технических систем передачи информации. Для передачи информации используется система символов (точек, тире, букв, цифр), которые по общему соглашению передающей и принимающей сторон имеют определенный смысл. Таким образом, основная задача трансляции информации — максимально точное ее воспроизведение. При установлении количественной меры информации I было принято использовать зависимость

I = n log2 s,

где s — полное число различающихся символов в принятой системе передачи, а n — длина последовательности, составленной из этих сигналов, т. е. длина текста. При этом используется логарифм по основанию 2, а за единицу измерения информации принят “бит” (Hartley, 1928).

При использовании методов теории информации для анализа пептидных структур мы должны пока исключить попытки интерпретации полученных результатов, считая, что каждая комбинация символов (аминокислотных остатков) определяется внутренней системой кодирования, эволюционно закрепленной живыми системами для точного воспроизведения. Поэтому вместо терминов “энтропия сообщения” (word entropy) и “информационное содержание” (content) мы будем использовать термин “информационная нагрузка” (charge), так как на современном уровне знаний содержание и смысл межмолекулярных взаимодействий недостаточно изучены.

При статистических расчетах нужно различать точную информацию и вероятностную. Точная информация отличается от вероятностной прежде всего необратимостью: информационное “сообщение” и форма его выражения имеют начало, определенную последовательность и конец, т. е. этот порядок необратим. Для долгосрочной фиксации точной информации человечество давно использует письменную культуру.

Рассматривая аминокислотные последовательности пептидов-регуляторов, представленных в табл. I—IV Приложения, мы увидим многое, что сближает их строение со структурой письменности. Они состоят из 20 различающихся элементов (аминокислот), имеют начало (N-концевая аминокислота) и конец (С-концевая аминокислота) и не имеют разветвлений. Еще в 60-е годы Дж. Бернал отмечал аналогию в структурной иерархии белков и нуклеиновых кислот с построением языка человеческого общения (Бернал, 1969).

Позднее другой исследователь, Де Дюв, отмечая, что пептиды различаются числом, природой и последовательностью своих аминокислотных остатков, сравнил их со словами разной длины, в написании которых использован алфавит из 20 букв. Это особенно наглядно видно, если в записи использованы однобуквенные символы. Так, например, тетрапептид Cys—Glu—Leu— Leu становится “CELL”, а нонапептид Ala—Arg—Cys—His—Glu—Thr—Tyr—Pro—Glu превращается в “ARCHETYPE”. “По существу, вся англоязычная литература могла бы быть записана аминокислотным алфавитом, если бы в нем не отсутствовали буквы В, J, О, U, X и Z” (Де Дюв, 1987. С. 43). Проблема состоит в том, чтобы расшифровать тексты того языка, на котором “разговаривают” или “переписываются” друг с другом элементы живых систем, в частности пептиды и клетки, и установить молекулярный (физико-химический) механизм, с помощью которого они обмениваются посланиями. По-видимому, для такой расшифровки необходимо знать тему и предметность, с которой ассоциирован текст.

В свое время для расшифровки кодированных текстов был разработан статистический метод отыскания стационарных участков в последовательности кодирующих знаков. В работах К. Шеннона (1963) и Н. Винера (1983) ставилась определенная цель: предсказать последовательность букв в тексте, когда, например, половина из них отсутствует, но есть частотные характеристики их парных, триграммных и тетраграммных сочетаний.

Со времен пионерской работы Шеннона функция распределения вероятностей в линейной последовательности знаков используется для оценки информационной нагрузки на один знак. В качестве меры упорядоченности и информационной значимости отдельных элементов (букв) текста было принято изменение энтропии последовательности при переходе от случайного распределения элементов в цепи к распределению, учитывающему количество повторов одних и тех же сочетаний букв в данной последовательности. Мы будем пользоваться этим методом при исследовании аминокислотных последовательностей нескольких регуляторных полипептидов.

Вычисление состоит из ряда приближений F0, F1, ..., FN, которые Шеннон назвал N-граммной энтропией, так как она учитывает на каждом этапе более определенные статистические связи между N аминокислотными остатками. Следует подчеркнуть, что этим связям не приписывается никакого энергетического содержания, так же как мы не рассматриваем энергию связи между буквами написанного слова. Семантическое содержание, т. е. значение, отражающее определенную физическую сущность, также не имеет отношения к количеству информации, вычисляемой для данной последовательности (Shannon, 1951).

Энтропия Fn для коротких последовательностей рассчитывается из обычных частотных таблиц отдельных знаков, диграмм, триграмм и тетраграмм. Для удобства дальнейших количественных сопоставлений энтропия последовательности вычисляется в битах, т. е. с использованием логарифмов по основанию 2.

Для аминокислотного “алфавита” из 20 букв, т. е. для кодируемых 20 аминокислот, нулевое приближение составляет

Fq = log2 20 = 4.32 бит/остаток

в предположении, что все аминокислоты встречаются в составе белка с равной вероятностью (Шеннон, 1963). Однако, как мы увидим, в природных пептидах этого не бывает.

Анализируя распределение вероятности для отдельных аминокислот и их сочетаний в составе каждого белка, можно оценить усредненное изменение энтропии, приходящееся на один аминокислотный остаток, как разницу N-граммной и (N — 1)-граммной энтропий. Изменение N-граммной энтропии, ∆FN, при добавлении к блоку еще одного остатка измеряет количество информации, которое приходится на добавленный остаток, и рассчитывается по формулам (Шеннон, 1963):

FN = -Σp(bi) log2р(bi),

∆FN = -Σ p(bi,j) log2p(bi,j) + Σp(bj) log2p (bi),

где bi — блок из (A- 1) остатка; p(bi) — вероятность блока bi, определяемая из частоты его появления; j — аминокислотный остаток, следующий за блоком bi; p(bpi, j) — вероятность блока из N остатков; ∆FN — среднее значение энтропии одного аминокислотного остатка при его добавлении к предыдущим (N - 1) остаткам.

Вычисления были проведены для нескольких регуляторных полипептидов с длиной последовательности 165—482 аминокислотных остатков (а. о.). Они значительно короче той длины (2.9 млн. а. о.), которая была использована в работе Вейса (Weiss et al., 2000), но достаточны для статистических оценок. В табл. V Приложения представлены их аминокислотные последовательности.

Нейроспецифический кальмодулин-связывающий белок Р-57 был выделен из мембран мозга. Этот белок характеризуется отсутствием упорядоченных участков цепи с а- или ß-структурой, и почти половина его аминокислотных остатков имеет гидрофильный характер. Вероятно, он составляет внешнюю часть мембранного рецептора (Wakim et al., 1987).

Тропонин Т — одна из субъединиц белка тропонина, регулирующего сократительную активность актомиозина в полосатой мышце. В отличие от предыдущего белка три четверти аминокислотных остатков тропонина Т включены в состав а-спиральных участков; 50 % аминокислотных остатков имеют ионогенные боковые группы (Leszyk et al., 1987).

Фактор роста эпителиальных клеток, выделяемый тромбоцитами (PDECGF), существенно отличается по молекулярной массе и аминокислотному составу от сосудистого фактора роста эпителиальных клеток (VEGF), хотя их физиологические функции достаточно близки (Heldin et al., 1991). Расчет выполнен также для нейротрофического фактора из глиальных клеток (GCDNF), стимулирующего рост допаминэргических нейронов (Lin et al., 1993), и для мембранного рецептора аквапорина 0, свойства которого мы рассмотрим в разделе 2.2 (Nemeth-Cahalan, 2000). Частотные характеристики аминокислотного состава этих белков были представлены в табл. 6.

Расчет FN проводили для аминокислотной последовательности каждого белка, читая ее слева направо (от N- к С-концу) и разбивая на блоки по 2, 3, 4 и 5 остатков; аналогично тому, как это было сделано для суммарной последовательности тканеспецифических пептидов в разделе 1.4.1, определяли частоту появления каждой N-граммы (Шатаева и др., 2002).

В табл. 8 представлены результаты расчета FN (N = 1, 2, 3, 4, и 5) для выбранных белков, а также повторяющиеся (устойчивые) блоки аминокислотных последовательностей в их структуре. Для всех указанных аминокислотных последовательностей значение F1 меньше теоретического значения 4.32 бит/остаток для равновероятного содержания аминокислот в пептиде. Из-за неодинаковой частоты включения аминокислотных остатков в цепь (селективность встраивания аминокислоты в цепь) первичная структура природного пептида оказывается более информативной, чем модельный пептид, содержащий все аминокислоты поровну.

При перечислении содержащихся в последовательности пар аминокислотных остатков в качестве знаков мы фактически переходим от 20-буквенного алфавита к алфавиту, состоящему из 400 знаков, для которого среднее значение энтропии F0 — 8.63 бит/знак при равновероятном присутствии всех знаков в последовательности. Однако большинство исследованных пептидов значительно короче, и далеко не все эти знаки встречаются в составе природных полипептидов.

Таблица 8 Средняя информационная нагрузка на аминокислотный остаток (а. о.) в составе регуляторных белков

Число остатков в N-грамме

FN, бит/блок

∆FN, бит/остаток

Повторяющиеся блоки

FN, бит/блок

∆FN, бит/остаток

Повторяющиеся блоки

Глиальный нейротрофический фактор (GCDNF), n = 211 a.o.

Белок Р-57, n = 239 а. о.

1

4.08

-0.24

A, L, D, S, R

3.51

-0.81

А, Е, D, G, R

2

7.00

2.92

DD. KR, RG, RR

6.51

3.0

АЕ, АР, ЕА, ED, ЕР

3

7.64

0.64

AAA, KRL, QAA, TSD

6.84

0.33

APA, AED, АЕА

4

7.66

0.02

LTSD, QAAA

7.84

1.0

AEDA, АРАА, DAPA

5

Нет

7.79

-0.05

АРААЕ

Фактор роста эндотелия сосудов (VEGF), n = 165 а. о.

Тромбоцитарный фактор роста эпителиальных клеток (PDECGF), n = 482 а. о.

1

4.09

Е, С, R, К, Р, Q, F, S

3.82

А, Е, G, L. R, V

2

6.88

2.79

KP, SC, CR, RC, RQ, GG

7.26

3.44

АА, AL, LV, RV

3

7.24

0.36

KAR, ARQ, CVP, CRP, KPH

8.68

1.42

AAL, GVG, LVL, RAL

4

7.35

0.11

KARQ

8.91

0.23

ALVL, LAP А, PADG

5

Нет

8.86

-0.05

RVAAA, VAAAL

Тропонин Т, n = 284 а. о.


Аквапорин 0, n = 263 а. о.

1

3.42

A, E, D. G. R

3.61

L. А, G, V, S, F, R, Т, Р

2

6.79

3.37

AE, EA, ED, EK, ER

6.76

3.15

LG, GA, AV, LA, VG, SL

3

7.74

0.95

AER, AED, EEE, AEE

7.83

1.07

ALA, VAL, RAI, AIС, ASL

4

7.96

0.22

AEDG, EAVE, EREK, RAER

7.90

0.07

VALA, RAIC

5

7.96

0

EAVEE

Нет

Интересно сравнить полученные статистические данные для аминокислотных остатков в пептидной цепи с результатами вычислений для последовательности букв в английском тексте, которые сделал К. Шеннон (1963). Нулевое значение F0 для английского алфавита составляет 4.7 бит/знак. Частота появления этих букв и их сочетаний в тексте дает значения F1 = 4.14, F2 = 3.56, F3 = 3.3 бит/знак. Частотных таблиц английского текста для N > 3 в те времена не было, но аналогия полученных закономерностей очевидна.

При увеличении N значение FN учитывает все более далекие статистические связи. Предельное значение FN зависит от длины последовательности и равняется 3.32 lg и, где n — суммарное число остатков в цепи.

Представленные данные демонстрируют постепенное уменьшение прироста энтропии при добавлении одного аминокислотного остатка к предыдущему блоку. Уменьшение A FN равнозначно повышению информационной нагрузки на один кодирующий знак при переходе от одного аминокислотного остатка к кодирующему знаку в размере ди-, три- и тетрапептида. Наибольший вклад в уменьшение прироста энтропии ∆FN, т. е. в информативность, вносит число повторений одной и той же регулярной последовательности в данной цепи. Значительное количество повторов дипептидных блоков по сравнению с повторами квартетов не является свидетельством их повышенного информационного содержания. Наоборот, исследование статистики букв и слов в английском языке показывает, что чаще всего в нем встречаются буквы Е, Н, Т и О, а наибольшая частота употребления относится к артиклю the и предлогам of и to, т. е. к словам, не имеющим самостоятельного значения, но определяющим систему отношений между значащими словами (Шеннон, 1963).

Повторяющиеся пептидные блоки у представленных белков не содержат ни ароматических боковых групп, ни гистидина и различаются по содержанию ионогенных и неполярных аминокислотных остатков. При сравнении данных табл. 6 и 8 можно увидеть, что в состав повторяющихся блоков входят только остатки аминокислот, занимающие первые 9 разрядов частотности. Наиболее гидрофильные блоки встречаются у тропонина Т, наиболее гидрофобные — в составе аквапорина 0.

Сравнение данных табл. 7 и 8 показывает, что регуляторный белок Р-57 и нейропептиды, принадлежащие к одной функциональной системе, имеют в своих структурах одинаковые димеры и близкие по структуре тетрамеры GEDA и AEDA. Напомним, что 4 аминокислотных остатка представляют собой пространственно завершенный оборот а-спирали без жесткости этой спирали (см. выше, раздел 2.2), и это позволяет тетрапептидным блокам подстраиваться к другим макромолекулам со спиральной конформацией, меняя в допустимых пределах шаг собственной спирали.

Если придерживаться того определения, что здравый смысл — это последовательность суждений, устойчивая к воздействию хаотической внешней информации, то представленные в табл. 8 блоки можно назвать “здравомыслящими”, так как они возникли и сохраняются на протяжении тысячелетий среди менее упорядоченных участков пептидной цепи. То, что они повторяются в структуре белка, свидетельствует о важности их информационной нагрузки. Обсуждая проблему повышения надежности информационных каналов мозга и вычислительной машины, Н. Винер отмечал важность дублирования механизмов передачи информации: “Вряд ли можно думать, что передача важного сообщения поручается одному нейронному механизму. Подобно вычислительной машине, мозг, по всей вероятности, действует согласно одному из вариантов знаменитого принципа, изложенного Льюисом Кэрроллом в “Охоте на снарка”: “Что три раза скажу, тому верь”” (Винер, 1983. С. 224).

Представленное в табл. 8 увеличение FN по мере удлинения анализируемых блоков отражает поэтапный прирост информации в последовательности как разницу средних значений энтропии при увеличении блока на один аминокислотный остаток. Это не очень точная мера, так как распределения вероятностей для димеров, тримеров и более длинных блоков весьма широки. Более точная оценка прироста информации, отнесенного к удлинению соседних блоков, возможна при расчете средних значений разности энтропий для каждого этапа удлинения блока (Эйген, Винклер, 1979).

Представленный метод расчета статистической энтропии пептидной цепи — простейший из используемых, так как он несложен для вычислений. Однако система РП, определяющая непрерывный спектр (континуум) регуляторных функций организма, характеризуется не только набором пептидов, но и их природной иерархией. Для выявления периодических и когерентных сигнальных последовательностей в подобных системах используются методы корреляционного анализа. В последнее время для оценки информации линейной последовательности знаков широко используется метод анализа непараметрических, или ранговых (rank), корреляций (Климонтович, 1999).

Следует, однако, подчеркнуть, что мера информации при всех статистических методах расчета установлена на основе математических, а не биохимических соображений. Оправданием их использования служат эмпирические наблюдения, которые показывают, что любые изменения состояния молекулы, при которых повышаются ее анизотропия или компактность упаковки, сопровождаются уменьшением энтропии и соответствующим увеличением информативности. В частности, значения стандартной энтропии катионных форм аминокислот и олигопептидов в растворе значительно выше стандартной энтропии их цвиттерионных форм (Biochemical microcalorimetry, 1969), т. е. количество информации, заключенной в молекуле цвиттериона, выше, чем в соответствующем катионе. Денатурация белковой макромолекулы, вызванная разрушением нативной структуры, сопровождается, как правило, повышением энтропии. Наоборот, переход полипептидной цепи из глобулярного состояния в а-спираль, т. е. переход от беспорядка к упорядоченности, сопровождается понижением энтропии и соответствующим повышением информационного содержания (Lumry, Rajender, 1970; Волькенштейн, 1981). Простейшее содержание молекулярной информации, которое можно себе представить, отражает устойчивость той или иной формы существования молекулы. Все дополнительное содержание — развитие этого элементарного сообщения.

Возможно, что корреляционный анализ аминокислотных последовательностей позволит выявить определенную взаимосвязь между структурой информационных пептидных блоков и механизмом пептидной регуляции. В перспективе это поможет установить в понятиях физической биохимии “семантическое” содержание информационных молекулярных сигналов.