Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Сравнительное моделирование структуры белков
Этапы сравнительного моделирования структуры белков
Отбор шаблонов

После того, как с помощью алгоритмов поиска сформирован список шаблонов, необходимо отобрать один или несколько шаблонов, подходящих для решения конкретной задачи моделирования. При отборе шаблонов необходимо учитывать ряд факторов.

3.2.2.1. Общие соображения при отборе шаблона

Наиболее простое правило отбора шаблона - выбрать структуру, сходство последовательности которой с исследуемой последовательностью максимально. Семейство белков, к которому принадлежат мишень и шаблоны, может включать несколько подсемейств. Построение множественного выравнивания и филогенетического дерева (Felsenstein 1981) может помочь при отборе шаблона из подсемейства, наиболее близкого к последовательности мишени. Также следует принять во внимание наличие сходства между “окружением” шаблона и окружением, в котором будет осуществляться моделирование мишени. Термин “окружение” в данном случае используется в широком смысле и подразумевает все, что не является собственно белком (например, растворитель, pH, лиганды, взаимодействия на уровне четвертичной структуры). Если это возможно, в общем случае следует использовать шаблон, связанный с теми же или близкими лигандами, что и исследуемая последовательность. Качество структур, определенных экспериментально, - еще один важный фактор при отборе шаблонов. Разрешение и фактор достоверности в случае кристаллической структуры и количество ограничений на остаток в случае ЯМР-структуры являются показателями их точности. Так, если два шаблона характеризуются близким уровнем сходства последовательности с мишенью, в общем случае следует использовать шаблон, определенный с более высоким разрешением. Критерии отбора шаблонов зависят также от цели, с которой создается сравнительная модель. Например, в случае построения модели “белок-лиганд” при отборе наличие в шаблоне близкого лиганда, вероятно, важнее, чем разрешение.

3.2.2.2. Преимущества использования нескольких шаблонов

Необязательно выбирать для моделирования единственный шаблон. На самом деле, оптимальное использование нескольких шаблонов увеличивает точность модели (Femandez-Fuentes et al. 2007а, b; Sanchez and Sali 1997; Venclovas and Margelevicius 2005); однако не все программы моделирования поддерживают возможность использования нескольких шаблонов. Преимущество сочетания нескольких шаблонных структур может быть двойным. Во-первых, структуры шаблонов, имея небольшое перекрывание между собой, могут быть выровнены с различными доменами мишени, и в таком случае с помощью процедуры моделирования можно построить гомологичную модель всей последовательности мишени. Во-вторых, структуры шаблонов можно выравнивать с одной и той же частью мишени, а модель строить с использованием того шаблона, который является лучшим для конкретной части исследуемого белка.

Более совершенный способ отбора подходящих шаблонов предполагает создание и оценку моделей для каждого потенциального шаблона и/или их сочетаний. Оптимизированные полноатомные модели можно затем оценить с помощью энергетической или оценочной функций, таких как стандартизованная оценка PROSA (Sippl 1995) или VERIFY3D (Eisenberg et al. 1997). Эти способы оценки обычно довольно точны и позволяют отобрать из числа созданных моделей наиболее адекватные (Wu et al. 2000). Такой метод проб и ошибок можно рассматривать как ограниченное протягивание (т.е. последовательность мишени продевается через близкие структуры шаблонов). Однако эти подходы хороши только при отборе различных шаблонов на глобальном уровне.

В недавно разработанном методе множественного картирования с различными шаблонами М4Т (от “Multiple Mapping Method with Multiple Templates”) отбор и сочетание многочисленных структур шаблонов осуществляется посредством многократной кластеризации, при которой учитываются “уникальный” вклад каждого шаблона, сходство их последовательностей между собой и с последовательностью мишени, а также экспериментальное разрешение (Femandez-Fuentes et al. 2007а, b). Полученные в итоге модели по качеству систематически превосходят модели, при создании которых используется единственный лучший шаблон.

Еще одно важное наблюдение, полученное в ходе обсуждаемых исследований, заключается в том, что если идентичность последовательностей составляет менее 40%, то модели, построенные с использованием нескольких шаблонов, точнее, чем построенные с использованием единственного шаблона. Эта закономерность становится все более выраженной по мере отдаления рассматриваемых пар “мишень-шаблон”. В то же время, преимущество использования нескольких шаблонов постепенно исчезает при идентичности последовательностей мишени и шаблона 40% и выше (рис. 3.1). Это свидетельствует о том, что в указанном диапазоне средние различия между структурами шаблона и мишени меньше, чем средние различия между структурами разных шаблонов, характеризующихся высокой степенью сходства с мишенью (Femandez-Fuentes et al. 2007b).