Практическая химия белка - А. Дарбре 1989

Предсказание конформации пептидов и белков
Исходные предпосылки расчетов
Попытки предсказания третичной структуры глобулярных белков

Идея предсказания третичной структуры глобулярных белков, исходя из аминокислотной последовательности, давно привлекала внимание исследователей. Ранние попытки в этой области носили в основном случайный характер, и только в последнее время появились работы, в которых разрабатываются подходы к решению упомянутой проблемы. Некоторые ученые, однако, продолжают придерживаться мнения, что подготовительный этап здесь еще не завершен и для выполнения серьезных, глубоких исследований время еще не наступило.

В настоящий момент уже ясно, что главные трудности связаны не с размером белковой молекулы, а с наличием па энергетической потенциальной поверхности такой молекулы минимумов. Поэтому первые работы были направлены на сглаживание потенциальных поверхностей, чтобы отчетливо выделялась траектория, ведущая к глобальному минимуму. При таком сглаживании, естественно, необходимо пожертвовать рядом деталей структурного представления белка. Основополагающей в методическом отношении здесь является работа Левитта и Варшела [33], но в качестве пионерской следует признать работу Птицина и Рашина [54] по предсказанию структуры миоглобина, исходя из существования отдельных а-спиралей. Моделирование самосборки белка осуществляли без применения ЭВМ, и поэтому спирали представляли в виде цилиндров. На поверхности этих цилиндров выделяли гидрофобные участки, которым разрешалось взаимодействовать друг с другом с образованием оптимальных структур. В результате оказалось, что одна из возможных упаковок спиралей соответствует наблюдаемой нативной структуре.

Более общий подход Левитта и Варшела допускает упрощенное представление не только спиральной, но и других конформаций. Предложенный алгоритм был запрограммирован для ЭВМ, что, однако, не делает метод свободным от ряда серьезных недостатков. Так, в основной цепи белка отсутствовала пептидная группа атомов СО-NH, Са-углеродные атомы соединялись виртуальной связью, а боковые цепи заменялись «укрупненными атомами» (большими искусственными атомами, заменяющими целые атомные группировки). Эта модель была впервые применена к небольшому белку — панкреатическому трипсиновому ингибитору [33]. В работе [33] был достигнут определенный успех, который с позиций сегодняшнего дня имеет в основном историческое значение. Следует отметить, что это исследование получило высокую оценку и вызвало оживленную дискуссию [14, 44]. Благодаря широкому обсуждению были выработаны общие подходы, применяемые при предсказании структуры белка, согласно которым любая соответствующая процедура должна: 1) быть полностью автоматической; 2) иметь входные параметры, применимые к любым белкам; 3) быть количественно воспроизводимой и 4) быть свободной от неоправданных приспособлений к конкретным объектам. Кроме того, единственной переменной входной информацией о белке должна служить его аминокислотная последовательность. Впоследствии именно Левитт внес большой вклад в развитие методов предсказания третичной структуры белков.

Изложенный выше метод резко отличается от предложенного ранее [30]. согласно которому укладка белковой цепи в пространстве выполняется с помощью компьютерного видеотерминала. В частности, интерактивная графика применяется как мощный инструмент белковой инженерии в лаборатории Бландела, который, однако, считает, что подобные технические новшества следует использовать достаточно осторожно. Действительно, многие решения, принимаемые человеком, несколько медленнее может выполнить и неинтерактивная программа, что делает получаемый результат достаточно объективным и воспроизводимым. Поэтому при экономии машинного времени за счет интеллектуальных возможностей важно быть уверенным, что есть и объективный (автоматический) путь решения.

Каким образом можно судить о качестве предсказания третичной структуры белка? В случае вторичной структуры белка для наглядной оценки результата (хотя и не всегда безупречной) служит число аминокислотных остатков с правильно предсказанным типом конформации. В случае третичной структуры сравнивают положения остатков в расчетной и экспериментальной структурах. Например, Левитт и Варшел использовали среднеквадратичное отклонение межостаточных расстояний в расчетной структуре и межостаточных расстояний в экспериментальной структуре. В кристаллографии белков эта величина не тождественна среднеквадратичному отклонению между расчетными и наблюдаемыми положениями атомов при сравнении похожих структур. Такое сравнение предполагает суперпозицию структур с использованием операций переноса и вращения какой-либо из структур по отношению к другой с целью минимизации среднеквадратичного отклонения. Главная трудность при сравнении состоит в том, что позиция ни одного из аминокислотных остатков не может считаться безусловно правильной или ошибочной. Кроме того, при усреднении отклонения («оценки») по всей молекуле белка маскируется разница между хорошо и неудачно предсказанными участками молекулы. В связи с этим среднеквадратичную оценку полезно дополнять таблицей остаток-остаточных расстояний [47, 49] и стереоизображениями молекул.

Одна из модельных укладок молекулы панкреатического ингибитора, полученная Левиттом и Варшелом, имела среднеквадратичную оценку в 6 Å, что по сравнению с нативной структурой считалось обнадеживающим результатом. Оказалось, однако, что величина среднеквадратичной оценки в 6 Å необязательно соответствует структуре, близкой к нативной [14]. Для того чтобы теоретическая укладка с оценкой в 6 Å была близка к нативной, необходимо соблюдение ряда дополнительных критериев, чего не было выполнено в работе по сворачиванию панкреатического ингибитора. В последние годы в ряде работ высказано мнение, что среднеквадратичное отклонение само по себе мало о чем говорит, а величине в 6 Å может соответствовать любая компактная случайная структура. Если же при моделировании процесса самоорганизации белка среднеквадратичная оценка с каждой итерацией все больше стремится к нулю, то можно сделать вывод, что укладка белка осуществляется успешно. Согласно данным, полученным в лаборатории автора при сравнении структур гомологичных белков, оценка сходства, равная <3 А, является признаком значимого сходства. В то же время оценка в 4 Å может уже соответствовать существенно различным структурам. Учитывая этот факт, а также то обстоятельство, что пет какой-ли бо другой объективной оценки результата, трудно рассчитывать на правильный вывод о схожести структур, если не преодолено пороговое значение 3 Å. Когда Левитт и Варшел применили свой ранее предложенный подход к парвальбумину, результат оказался плохим, и поэтому осталось неясным, приложим ли этот метод к другим белкам, кроме панкреатического трипсинового ингибитора.

В альтернативном подходе [28] за небольшое число итераций была достигнута среднеквадратичная оценка в 4,7—6,5 А для трипсинового ингибитора и 4,0—6,0 А для рубредоксина. Вместо энергетических расчетов применялся метод оптимизации, с большим числом ограничений, связанных с экспериментальными сведениями о белковой структуре. При отклонении какой-либо расчетной физической величины от ожидаемого значения накладывался штраф, размер которого увеличивался с ростом отклонения. Не вполне ясной остается система штрафов для участков структуры, для которых отсутствуют экспериментальные данные. Кроме того, полученный результат является достаточно грубым, так как все аминокислотные остатки аппроксимировались «гигантскими атомами». Однако качество предсказания этим методом — самое лучшее на начало 1980 г., и, по-видимому, применяемый алгоритм может быть полезен для построения стартовой конформации белка перед ее тщательной энергетической минимизацией.

Кроме разобранных методов предсказания можно назвать алгоритм Шераги [44, 73], который использует метод Мойте- Карло в модификации Метрополиса (разд. 21.4.3). В качестве первого шага при укладке полипептидной цепи белка в подходе Шераги осуществляется предсказание вторичной структуры. О качестве получаемых результатов судить затруднительно, но, по-видимому, оно не хуже, чем при моделировании процесса самоорганизации белков по Левитту — Варшелу.