Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Сравнительное моделирование структуры белков
Этапы сравнительного моделирования структуры белков
Оценка моделей

После того, как модель построена, важно проверить ее на наличие возможных ошибок. Качество модели можно приблизительно оценить по степени сходства мишени и шаблона. Идентичность последовательностей выше 30% позволяет дать относительно хороший прогноз ожидаемой точности модели. Если идентичность последовательностей опускается ниже 30%, то этот критерий становится значительно менее надежным при оценке ожидаемой точности одиночной модели. Именно в таких случаях наиболее информативны методы оценки моделей.

Можно провести оценку двух типов. При “внутренней” оценке самосогласованности проверяется, удовлетворяет ли модель ограничениям, которые использовались для ее расчета, в том числе ограничениям, основанным на структуре шаблона или статистических наблюдениях. “Внешняя” оценка основана на информации, которая не используется при расчете модели.

Оценка стереохимии модели (например, длин связей, величин валентных и двугранных углов и расстояний несвязанных атомов) с помощью таких программ, как PROCHECK (Laskowski et al. 1993) и WHATCHECK (Hooft et al. 1996), - это пример внутренней оценки. Ошибки в стереохимии редки и менее информативны, чем ошибки, определяемые методами внешней оценки, однако кластер химических ошибок может свидетельствовать о том, что соответствующая область также содержит другие существенные ошибки (например, ошибки выравнивания).

С помощью внешней оценки можно как минимум ответить на вопрос, верный ли шаблон был использован при моделировании. К счастью, неверный шаблон можно легко определить с помощью доступных в настоящее время оценочных функций. Более сложная для оценочных функций задача состоит в предсказании ненадежных областей модели. Один из путей решения этой проблемы заключается в том, чтобы рассчитать “псевдоэнергетический” профиль модели, такой, например, как в методах PROSA (Sippl 1993) или Verify3D (Eisenberg et al. 1997). Профиль отражает энергию для каждого положения модели (рис. 3.3). Пики профиля часто соответствуют ошибкам модели. Существует несколько подводных камней использования энергетических профилей для определения локальных ошибок. Так, область может быть определена как ненадежная лишь потому, что она взаимодействует с неверно смоделированной областью (Fiser et al. 2000). В других подходах, разработанных в недавнем прошлом, для оценки моделей, либо целиком (Eramian et al. 2006), либо локально (Fasnacht et al. 2007), обычно используется сочетание различных входных данных. В лучших методиках оценки качества моделей при тестировании используется простой консенсусный подход, в рамках которого надежность модели оценивается на основе того, насколько она согласуется с альтернативными моделями, которые иногда получают различными методами (Wallner and Elofsson 2005а, 2007). Оценка моделей - важная, но сложная область, поскольку одна из основных ее проблем представляет собой замкнутый круг: эффективная оценка моделей требует использования таких термов оценочной функции, которые уже применялись для создания самих точных моделей.

Image

Рис. 3.3. (Цветную версию рисунка см. на вклейке.) Зависимость энергии остатков от положения остатков в последовательности для двух различных моделей одного и того же белка. Энергия рассчитана с использованием статистического потенциала парных взаимодействий. Отрицательные (синего цвета) и положительные (красного цвета) значения энергии указывают на энергетически благоприятное и неблагоприятное окружение остатков соответственно. Профили энергии соответствуют моделям, представленным справа. Менее точная модель располагается над более точной. Отдельные участки моделей показаны тем же цветом, что и соответствующие им профили энергии. Фактическая экспериментальная структура показана серым