Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Предсказание функции белков на основе их теоретических моделей
Модели белков как общедоступный ресурс
Базы данных моделей

Для эффективного использования структурных моделей белков необходимо представить их научному сообществу в таком виде, чтобы они могли быть доступны отдельным исследователям. Создание публичных хранилищ могло бы стимулировать использование моделей при планировании экспериментальных работ. В настоящее время общедоступны два типа баз данных моделей пространственных структур белков.

Такие базы данных, как MODBASE (Pieper et al. 2006) и SWISS-MODEL Repository (Корр and Schwede 2004) (см. Таблицу 12.1), содержат модели, полученные полностью автоматизированными методами. Другие базы данных, как PMDB (Protein Model Database) (Castrignano et al. 2006), разработаны для хранения и работы с моделями, построенными вручную.

Вне зависимости от принципов устройства все базы данных имеют веб-интерфейс для доступа к интересующим моделям, а также предоставляют дополнительную информацию, включая оценку надежности модели и аннотацию функции белка.

Для того, чтобы обеспечить точность моделей, достаточную для их использования в экспериментальных исследованиях, заложенные в SWISS- MODEL Repository и MODBASE подходы основываются на сравнительном моделировании, которое в настоящее время является наиболее надежным методом при реализации масштабных проектов. Обе базы данных отображают степень идентичности между последовательностью белка-мишени и шаблона, a SWISS-MODEL Repository вообще содержит лишь модели с идентичностью, превышающей 40%. Последовательности белков-мишеней выбираются из базы данных UniProt (http://www.expasy.uniprot.org/) и оба упомянутых хранилища регулярно обновляются вслед за базами данных последовательностей и структур, включая в себя новые или модифицированные последовательности белков-мишеней и используя новые структуры в качестве шаблонов. Оба хранилища предоставляют также доступ и к выравниваниям, согласно которым были построены модели, но их подходы к оценке качества моделей отличаются. Качество упаковки моделей, содержащихся в хранилище SWISS-MODEL, оценивается с помощью метода ANOLEA (Melo and Feytmans 1998) и вычисления энергии согласно силовому полю GROMOS96 (van Gunsteren 1996), в то время как MODBASE оценивает надежность моделей по статистическим критериям (Melo et al. 2002). Визуализация моделей, реализованная в SWISS-MODEL Repository, дает также графическое представление аннотации на доменном уровне и аннотации функции белка согласно InterPro, а визуализация в MODBASE позволяет отобразить также вероятное связывание лиганда и сайты аннотации однонуклеотидных полиморфизмов (SNP).

Таблица 12.1. Базы данных рассчитанных моделей, доступные через веб-интерфейс

База данных

URL http://

SWISS-MODEL Repository (Корр and Schwede 2004)

swissmodel.expasy.org/repository/

MODBASE (Pieper et al. 2006)

salіIab.org/modbase

PMDB Protein Model Database (Castrignano et al. 2006)

www.caspur.it/PMDB

Protein Model Portal

www.proteinmodelportal.org/laboheme.df.ibilce.unesp.br/

DBMODELING (Silveira et al. 2005)

db_modeling/

Коллекция моделей в базах данных MODBASE и SWISS-MODEL Repository, а также материалы, собранные в исследовательских центрах, участвующих в проекте PSI, доступны через единый интерфейс, предоставляемый порталом Protein Model Portal. Этот портал разработан для одновременного опроса всех включенных в него баз данных при поиске уже рассчитанных моделей для данной аминокислотной последовательности, а на странице с результатами поиска представлен список моделей, размещенных в конкретной базе данных, и обеспечен доступ к ним.

Модели, создаваемые с участием человека (обычно это трудные случаи, которые требуют нетривиальных методов при построении моделей и выборе наиболее надежной структуры среди нескольких альтернатив), размещены в базе данных PMDB. Эта БД призвана обеспечить доступ к моделям, опубликованным в научной литературе, вместе с подтверждающими их экспериментальными данными, но в настоящий момент большая часть моделей - это предсказания, полученные в рамках С ASP. PM DB предоставляет возможность отдельным моделистам пополнять базу своими моделями вместе с подтверждающими их экспериментальными свидетельствами, а пользователи могут свободно скачивать различные модели одного и того же белка-мишени или модели различных областей такого белка. В случаях, когда это возможно, предоставляется также ссылка на БД последовательностей SwissProt (http://www.ebi.ac.uk/swissprot/). После расшифровки структуры белка к соответствующей записи в базе данных добавляется также ссылка на экспериментальную структуру в PDB (http://www.rcsb.org/pdb/home/home.do).

Помимо масштабных хранилищ моделей есть и те, которые посвящены отдельным организмам. В качестве примера можно привести DBMODEL- ING (Silveira et al. 2005) - это база данных, предназначенная для создания лекарственных средств для борьбы с различными инфекциями. К настоящему моменту эта БД содержит сравнительные модели белков, закодированных в геноме только двух патогенных организмов Mycobacterium tuberculosis и Xylella fastidiosa, являющихся возбудителями пестрого хлороза цитрусовых.