Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Сравнительное моделирование структуры белков
Применение сравнительного моделирования
Сравнительное моделирование и проект исследования структуры белков

Идея проектов по исследованию генома будет реализована полностью только тогда, когда мы определим и поймем функции новых закодированных белков. Такому пониманию значительно поспособствует структурная информация обо всех или почти всех белках. Множество структурных данных будет получено с помощью структурной геномики (Burley et al. 2008; Chance et al. 2002), крупномасштабного определения белковых структур методами рентгеновской кристаллографии и спектроскопии ядерного магнитного резонанса при эффективном сочетании с точными, автоматизированными и крупномасштабными методами сравнительного моделирования белковых структур. Учитывая производительность современных методов моделирования, представляется разумным в качестве результата экспериментов ожидать модели, построенные на основе по крайней мере 30%-ной идентичности последовательностей (Vitkup et al. 2001), соответствующие одной экспериментально определенной структуре на семейство последовательностей, а не на семейство укладки.

Чтобы масштабное сравнительное моделирование, необходимое для структурной геномики, стало возможным, этапы сравнительного моделирования сочетают в полностью автоматизированных разработках, таких как хранилища SWISS-MODEL или MODBASE (Корр and Schwede 2006; Pieper et al. 2006), каждое из которых содержит более миллиона моделей. Статистические данные в этих базах свидетельствуют о том, что приблизительно для 70% известных белковых последовательностей можно создать модели составляющих их доменов. Это можно утверждать на основании того факта, что почти 2000 структур были размещены в базах центрами структурной геномики, основными объектами исследования которых являются новые способы укладки и новые структуры. Эти пополнения составили 73% новых структурных свойств в базе PDB за последние 7 лет (Burley et al. 2008).

В то время как известное на сегодняшний день число белков, для которых получены хотя бы частичные модели, выглядит впечатляюще, как правило, модель построена только для одного белкового домена. В среднем же белки обычно имеют два или три домена. Например, средний размер открытой рамки считывания дрожжей составляет 472 аминокислотных остатка, а средний размер домена в САТН, базе структурных доменов, составляет 175 остатков. Средний размер модели в MODBASE, базе данных сравнительных моделей, лишь немногим выше - 192 остатка. Более того, две трети случаев моделирования характеризуются идентичностью последовательности менее 30% между ближайшими шаблонами.