Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Распознавание фолда
Введение
Важность “слепых” испытаний: соревнование CASP

За последние 30 лет было разработано огромное разнообразие методов, нацеленных на решение проблемы предсказания структуры белков в целом и распознавание способов укладки в частности. Как и в случае других научных начинаний, в данном случае крайне важно, чтобы любая новая методика была полностью протестирована “экспериментально”. Именно поэтому возник конкурс критической оценки методов предсказания структуры белков CASP (Critical Assessment of Structure Prediction) (http:// predictioncenter.llnl.gov/; Moult et al. 2007). Целью конкурса, или рабочего совещания, CASP (который проводится каждые два года) является моделирование природного состояния аминокислотной последовательности, структура которой неизвестна. Однако есть важная особенность - организаторам конкурса структура известна. Структуры белков, предлагаемых к рассмотрению в конкурсе, определяется экспериментальными методами незадолго до конкурса, однако эти данные становятся доступны научному сообществу лишь после его завершения. В результате, эксперты конкурса находятся в довольно необычной ситуации: им известна пространственная структура ряда белков, о которой ничего не известно специалистам по предсказанию.

CASP функционирует как система “слепой” экспериментальной оценки различных методов предсказания структуры в реальных условиях, поэтому именно идея соревнований CASP использовалась для определения набора методов, которые будут описаны в этой главе. Это вовсе не означает, что методы, не описанные здесь, не дают достоверных результатов, которые по каким-то причинам не были продемонстрированы в CASP. В последние годы были разработаны буквально сотни методов предсказания структуры, и чтобы не перегружать читателя, результаты соревнований CASP используются как фильтр. Обзор последних результатов CASP7 представлен в дополнительных материалах CASP7 (Moult et al. 2007).

2 Напомним, что на начало 2013 года число структур в базе данных PDB составляет около 87 тысяч. Прим. перев.