Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Предсказание структуры мембранных белков
Множественные выравнивания последовательностей

Важную роль в предсказании структуры ТМ белков играют множественные выравнивания последовательностей. Гомологичные последовательности, найденные в базах данных, можно использовать для создания профилей последовательностей, которые могут существенно увеличивать точность предсказания ТМ топологии (Kall et al. 2005; Jones 2007), а найденные шаблоны можно использовать для моделирования по гомологии.

В ходе применения традиционных методов парного выравнивания подходящие для исследуемого белка последовательности отбирают на основе значений оценочной функции. Эти значения получают с использованием матриц аминокислотных замен, таких как РАМ (Dayhoff et al. 1978) или BLOSUM (Henikoff and Henikoff 1992). Такие матрицы разрабатывались для выравнивания глобулярных белков, и, поскольку глобулярные и ТМ белки значительно отличаются по аминокислотному составу, гидрофобности и характеру консервативных фрагментов (Jones et al. 1994а), эти матрицы в принципе непригодны для выравнивания ТМ белков. В связи с этим для трансмембранных белков были разработаны специальные матрицы замен, учитывающие их свойства. Так, ТМ матрица JJT (Jones et al. 1994b) была разработана с учетом того факта, что в трансмембранных белках полярные остатки характеризуются высокой консервативностью, а гидрофобные - взаимозаменяемостью. Матрица SLIM (Muller et al. 2001) характеризуется высокой точностью при определении отдаленных гомологов в курируемом экспертами массиве последовательностей GPCR. Матрица РНАТ (Ng et al. 2000) по показателям производительности превосходит JJT, особенно в области поиска по базам данных. Тем не менее, на сегодняшний день не существует независимых исследований, в которых была бы проведена оценка ТМ матриц замен с использованием общего массива данных.

Некоторые новые методы характеризуются более высоким качеством выравнивания ТМ белков. В STAM (Sharif and Gut 2004) размер штрафа, налагаемого за вставки/делеции в ТМ сегменты, выше, чем аналогичное значение для вставок/делеций в петлевые области. Кроме того, в методе применяются различные матрицы замен. В результате этого модели, построенные по гомологии с применением метода, отличаются более высокой точностью. PRALINEТМ (Pirovano et al. 2008) сочетает в себе новейшие методы предсказания последовательностей с использованием мембранспецифичных матриц замен. Было показано, что производительность метода выше в сравнении с такими стандартными методиками множественных выравниваний, как ClustalW (Higgins et al. 1994) или MUSCLE (Edgar 2004). В исследовании использовался контрольный массив данных для оценки качества трансмембранных выравниваний BaliBASE (Bahr et al. 2001). Последние изменения, введенные в BLAST и PSI-BLAST (Altschul and Koonin 1998) для отражения состава исследуемой последовательности, теоретически должны повышать качество поиска ТМ белков (Altschul et al. 2005), однако независимые исследования в этом случае также не проводились. Усовершенствованный метод выравнивания T-Coffee (Notredame et al. 2000), несмотря на использование одной общей матрицы оценки, отличается качеством результатов в случае высокой идентичности последовательностей. Исследования проводились на контрольном массиве структур гомологичных мембранных белков. В методе НМАР (Tang et al. 2003) значительное улучшение качества выравниваний достигается за счет применения анализа и сравнения профилей, которые содержат информацию о структурах.