Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Интегральные серверы для предсказания функции по структуре
ProKnow
Подбор типа укладки

Первая стадия в ProKnow состоит в поиске других белков, имеющих такую же укладку, что и рассматриваемый белок, или максимально похожую на неё. Конечно, это в некоторой степени жульничество, поскольку ProKnow требует от пользователя сперва использовать программу по распознаванию сходных укладок DALI (Holm and Sander 1998), а затем её результат в формате FSSP и загружать на сервер.

Image

Рис. 10.2. Схема генной онтологии, сгенерированная для PDB-структуры 2fck, которая показывает иерархию функциональных термов от общих к специфическим. В тех случаях, когда ProKnow предсказывает более одного функционального варианта, на схеме показывается их сеть, где каждый из вариантов связан с остальными сходными вариантами линиями, раскрашенными в зависимости от сходства

Совпадения, полученные с помощью Dali, и являются первыми ключами к функции белка, которые используются в ProKnow.

Любопытно, но если загрузить на сервер одну лишь последовательность, то всю работу ProKnow делает сам: определяет укладку, совместимую с последовательностью, и использует её как ключ к функции. Для определения наиболее вероятной укладки сервер ProKnow использует результаты сервера по распознаванию фолда, созданному в UCLA. Этот сервер также реализует стратегию из нескольких шагов. Сначала, используя программу BLAST, он пытается найти совпадения рассматриваемой последовательности с последовательностями структур PDB. Затем он пробует получить результат с помощью итеративной программы PSI-BLAST. Если обе попытки заканчиваются неудачей, то сервер использует результат предсказания вторичной структуры белка, полученный от сервера PSIPRED, поддерживаемого Университетским колледжем в Лондоне (Bryson et al. 2005). Это предсказание подается в программу SDP (Sequence Derived Properties, Fischer and Eisenberg 1997), которая пытается подобрать подходящий тип упаковки. Наконец, если даже это ничего не дает, то в ход идет метод, названный DASEY (Directional Atomic Solvation EnergY, Mallick et al. 2002).

Image

Рис. 10.3 а) Лучшие предсказания функции сервера ProKnow для PDB структуры 2fck. Наиболее достоверное предсказание говорит об N-ацетилтрасферазной активности белка, б) Сводная таблица ключей, использованных в предсказании каждого ГО-терма для 2fck. Кликнув на любое число, можно увидеть детальную информацию по данному ключу

Полагаясь на результаты любого метода по распознаванию фолда, или протягивания, нужно помнить одно - эти методы представляют что-то вроде черной магии и требуют осторожной интерпретации. Порой они могут давать примерно правильный ответ - обычно это бывает в случае небольших однодоменных белков, где получаются топологически почти правильные модели (Moult 2005); но в общем случае точность широко варьируется. Если же последовательность белка очень длинная, то шансы на успех становятся еще меньше, поскольку белок почти наверняка состоит из нескольких структурных доменов, границы которых было бы идеальным определить вручную. Тогда нужно будет распознать укладку каждого домена, но даже если эти стадии оказались успешными, пространственное расположение доменов может стать принципиально важным для функционирования белка, а методы предсказания упаковки доменов еще не достигли своей зрелости (Wollacott et al. 2007; Berrondo et al. 2008).