Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Предсказание функции белков на основе их теоретических моделей
Модели белков как общедоступный ресурс

Как ранее было упомянуто в Главе 3, одной из целей структурной геномики и, в частности, проекта PSI (Protein Structure Initiative), является экспериментальное получение таких белковых структур, которые позволили бы максимально охватить пространство белковых укладок. За прошедшие 7 лет в научных центрах, участвующих в этом проекте, было определено около 3 тысяч структур, что составляет примерно 40% от общего числа новых структур с ранее неизвестной укладкой, размещенных в базе данных PDB (Service 2008а). В то же время в области предсказания белковых структур было приложено много усилий для улучшения алгоритмов и программ позволяющих теоретическим моделям приблизиться как можно ближе к структурам, полученным экспериментально. Успешные этапы мероприятия CASP (англ. Critical Assessment of techniques for protein Structure Prediction - Критическая оценка методик предсказания белковых структур), являющегося индикатором успехов в данной области (Kryshtafovych et al. 2005), показали, что точность предсказания структуры непрерывно повышается. Если бы модели были плохого качества, то от них было бы мало практической пользы, но на самом деле в среднем для 80% белков, предлагаемых в качестве мишеней в CASP, построенные модели оказываются достаточно близки и содержат больше полезной информации, чем содержалось в шаблоне (Kryshtafovych et al. 2007). (Добавленная ценность моделей по отношению к последовательности и шаблону обсуждается ниже более детально.) Растущее число новых описанных типов укладки, полученное благодаря структурной геномике и росту точности компьютерных методов, приводит к возможности создания возрастающего числа моделей белков. Согласно недавним оценкам, новые структуры, расшифрованные в рамках проекта PSI, позволяют получить около 40 тысяч моделей на основании гомологии, которые иначе не могли быть получены (Service 2008b). Однако для того, чтобы воспользоваться этим множеством моделей в полной мере, они, наряду с информацией об их надежности, должны быть свободно доступны биологам.