Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Сравнительное моделирование структуры белков
Этапы сравнительного моделирования структуры белков
Выравнивание последовательности со структурой

При построении модели во всех программах сравнительного моделирования используется принятый в качестве допущения список структурных соответствий между остатками мишени и шаблона. Этот список составляется при выравнивании последовательностей мишени и шаблонов.

Image

Рис. 3.1. Сравнение точности (ось у) моделей, построенных для одного и того же набора из 765 последовательностей белков-мишеней. Построение осуществлялось с использованием одного шаблона (показан только результат с лучшим значением математического ожидания, столбцы темно-серого цвета) или нескольких шаблонов (столбцы светло-серого цвета). Степень идентичности последовательностей (ось х) рассчитывалась для результата с наибольшим значением математического ожидания и последовательностью исследуемого белка. Планками погрешности показана стандартная средняя ошибка

Такое выравнивание осуществляется во многих методах поиска шаблонов, иногда оно может непосредственно использоваться при моделировании в качестве входных данных. Тем не менее, часто, в особенности в сложных случаях, это начальное выравнивание не является лучшим, например, при идентичности последовательностей менее 30% (где идентичность последовательностей определяется как число идентичных положений в выравнивании, нормированном на длину последовательности мишени). Методы поиска обычно настроены на определение отдаленных связей, которое на практике часто осуществляется посредством сравнения локальных мотивов, а не полноразмерного оптимального выравнивания. Таким образом, после того, как шаблоны отобраны, метод следует использовать для выравнивания шаблонов относительно последовательности мишени. Выравнивание относительно легко получить в тех случаях, когда идентичность последовательностей мишени и шаблона составляет 40% и выше. Если идентичность последовательностей менее 40%, точность выравнивания становится главным фактором, определяющим качество полученной модели. Ошибочное выравнивание лишь одного остатка приводит к ошибке в модели, величина которой составляет около 4 Å.

3.2.3.1. Использование структурной информации при выравнивании

Выравнивания в сравнительном моделировании составляют уникальную группу, поскольку с одной стороны в них всегда находится пространственная структура - шаблон. Следовательно, качество выравнивания можно улучшить, если учесть информацию о структуре шаблона. Так, следует избегать вставок в элементах вторичной структуры, в заглубленных областях или между остатками, которые располагаются далеко друг от друга в пространстве. Такие критерии учитываются в некоторых методах выравнивания (Blake and Cohen 2001; Jennings et al. 2001; Shi et al. 2001).

В тех случаях, когда в наличии имеется несколько структурных шаблонов, можно сначала наложить их друг на друга для получения множественного структурного выравнивания, которое позволит выявить остатки, консервативные в структурном отношении (Al Lazikani et al. 2001; Petrey et al. 2003; Reddy et al. 2001). На следующем этапе осуществляется выравнивание последовательности мишени относительно имеющегося множественного структурного выравнивания. Преимущества использования нескольких структур и нескольких последовательностей заключаются в получении структурной и эволюционной информации о шаблонах, а также эволюционной информации о последовательности мишени. Использование такой информации часто приводит к том, что для моделирования удается получить выравнивание, качество которого выше по сравнению с аналогичными результатами методов парного выравнивания последовательностей (Jaroszewski et al. 2000; Sauder et al. 2000).

В методе множественного картирования МММ (от Multiple Mapping Method) прямо используется информация о пространственной структуре (Rai and Fiser 2006; Rai et al. 2006). Минимизация ошибок выравнивания в МММ осуществляется за счет отбора и оптимального склеивания фрагментов, для выравнивания которых применялись различные методы. Фрагменты составляют ряд различных выравниваний, использующихся в качестве входных данных. Критерием отбора фрагментов служит оценочная функция, на основании которой определяется предпочтительное положение фрагмента последовательности мишени в структурном окружении шаблона. В оценочную функцию входит четыре члена, которые используются для оценки совместимости альтернативных переменных сегментов белкового окружения: а) специфичные к окружению матрицы замены FUGUE (Shi et al. 2001); б) матрица аминокислотных замен BLOSSUM (S. Henikoff and Henikoff 1992); в) специальная матрица замен НЗР2, которая предназначена для оценки степени совпадения предсказанной вторичной структуры последовательности мишени с наблюдаемой вторичной структурой и типа доступности остатков шаблона (Luthy et al. 1991); г) полученный на основе статистических данных потенциал парных взаимодействий остатков (Rykunov and Fiser 2007). По сути, в МММ выполняется ограниченное обратное протягивание коротких фрагментов: задачей при осуществлении протягивания является не определение правильного способа укладки, а выбор из множества доступных картированных альтернатив выравнивания для сегментов последовательности, которые протянуты через одну и ту же укладку. Такие локальные картирования определяются для остальной части модели, при этом выравнивания являются основой последовательного решения и задают границы оценки.