Принципы структурной организации белков - Г. Шульц 1982

Предсказание вторичной структуры по аминокислотной последовательности
Вероятностные методы
Склонность двух остатков одновременно встраиваться во вторичную структуру

Склонности дублетов включают взаимодействия остаток — остаток. Строгое предсказание основано на частотах встречаемости дублетов. Вопреки Финкельштейну и Птицыну [343] многие методы предсказания используют информацию о дублетах, поскольку такая информация отражает взаимодействие между близкими по цепи остатками. Перити [344] воспользовался дублетами для предсказания а-спиралей и ß-структур чисто вероятностным методом. Он рассмотрел 27 дублетов, в каждом из которых остатки находились в положениях і ± 1, i ± 2, ..., і ± 6, полагая, что при более далеких расстояниях между остатками взаимодействия отсутствуют. Всего было получено 10 800 дублетов различных типов**. Для каждого остатка Перити рассматривал возможность реализации состояний а, ß и клубка (состояние, не являющееся ни а и ни Р). Таким образом, по экспериментальному набору данных была составлена таблица из 32 400 = 3∙10 800 частот встречаемости, которые были интерпретированы как склонности. Для предсказания вторичной структуры данного остатка в конкретной аминокислотной последовательности по таблице оценивались и комбинировались по стандартной статистической методике склонности к а- (ß-, клубок-) структуре 27 типов дублетов. Таким путем был получен a-(ß-, клубок-)потенциал. Затем a-(ß-, клубок-)потенциалы сопоставлялись и самый высокий из них выбирался для определения состояния. Следует отметить, что этот метод не содержит изменяющихся параметров. Кроме того, он не позволяет отдельно предсказать а- и ß- структуры, a объединяет их довольно искусственным способом.

* Для остатка в положении і имеются семь дублетов вида (і, і + 6), (і — 1, i + 5), ..., (і — 6, і), шесть дублетов вида (і, і + 5), ..., (і — 5, і)... и два дублета (і, і + 1), (і — 1, і), что в сумме составляет 7 + 6 + 5 + 4 + + 3 + 2 = 27 различных дублетов. Каждый дублет состоит из двух остатков. Для 20 различных типов остатков возможны 20 ∙ 20 = 400 различных комбинаций. Таким образом, число дублетов различных типов составляет 27 ∙ 20 ∙ 20 = 10 800.

Неизменные потенциалы и варьируемые пороги. Для предсказания a-, ß- и rt-конформаций Робсон и сотр. [345—352] использовали синглеты совместно с 16 дублетами, образованными анализируемым остатком и остатками, находящимися в положениях i± 1 : i ± 8. Склонности синглетов и дублетов были определены по соответствующим частотам встречаемости в базовом наборе, а затем преобразованы в a-, ß- и rt-потенциалы для данного положения остатка с помощью стандартных методов теории информации. Эти потенциалы сопоставлялись с тремя различными порогами, по одному на каждый тип вторичной структуры. Была проведена также раздельная коррекция всех трех порогов по лучшему соответствию между предсказываемой и наблюдаемой в базовом наборе вторичной структурой. Предсказания a-, ß- и rt-структур проводились независимо одно от другого.

Варьируемые потенциалы и варьируемые пороги. Нагано [228, 353—356] использовал те же дублеты, что и Перити [344], с тем различием, что в качестве максимального расстояния было принято не 6, а 7 остатков. Это дало 35 дублетов, влияющих на анализируемый остаток, поэтому таблица наблюдаемых частот встречаемости (склонностей) содержала 20 ∙ 20 ∙ 35 ∙3 = 42 000 значений. Таким путем были определены склонности всех типов дублетов данного остатка конкретной аминокислотной последовательности, а затем их линейной комбинацией были получены a-, ß- и rt-потенциалы.

Аналогично Робсону и сотр., Нагано обосновывал свое предсказание на раздельном сопоставлении потенциалов с тремя разными порогами. Каждый порог подгонялся до достижения наилучшего соответствия в базовом наборе. Кроме того, задавая потенциалы в виде линейных комбинаций, содержащих 3∙35 = 105 коэффициентов, по три (а, ß, rt) на каждый из 35 типов дублетов, Нагано ввел дополнительно большое число подобранных параметров. Все эти параметры варьировались до получения наилучшего соответствия в базовом наборе. Таким образом, Нагано использовал большее число подобранных параметров, чем Перити, а также Робсон и сотр., которые определяли свои потенциалы по склонностям с использованием стандартных вероятностных процедур.

Нагано также расширил использующийся базовый набор путем добавления (с малым весом) информации, полученной из аминокислотных последовательностей белков, гомологичных белкам с известной структурой, и в своей более поздней работе [356] он предпринял попытку учета частот встречаемости и склонности триплетов. Следует отметить, что в методе Нагано в неявном виде включались и синглеты, поскольку некоторые линейные комбинации склонностей дублетов эквивалентны склонности синглета.

Предсказания остатков, прерывающих вторичную структуру. Воспользовавшись только одним типом дублетов, а именно парой (і — 1, і + 1) двух соседних остатков анализируемого остатка і, Кабат и By [357—359] попытались развить метод «отрицательного» предсказания, с помощью которого можно было бы идентифицировать остатки, прерывающие а-спираль и ß-структуру. Склонности к а- и ß-нарушениям были получены из частот встречаемости в базовом наборе. Потенциал рассматривался как характеристика соответствующей склонности остатка. Пороги потенциалов подбирали по наилучшему совпадению с имеющимися экспериментальными данными.