Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Интегральные серверы для предсказания функции по структуре
ProKnow
Успешность предсказания

На рисунке 10.3 показана часть результатов для нашего примера, структуры 2fck. Тип укладки по данным Dali совпадает почти исключительно с ацетилтрансферазами. Поиск с помощью BLAST в базе данных UniProt также обнаруживает ряд хороших совпадений с ацетилтрансферазами. Поиск с помощью RIGOR предлагает нам несколько тупиковых путей в виде фактора роста фибробластов, липид-связывающего белка липовителлина и интегразы. Среди результатов PROSITE тупиковых путей больше, и они выводят нас на короткие мотивы, два из которых являются центрами фосфорилирования и один центром миристоилирования (все они на веб-сайте PROSITE имеют комментарий: “В некоторых случаях эта запись может не приниматься во внимание программой, поскольку является слишком неспецифичной”). Поиск с помощью DIP ничего не дал. Тем не менее, ошеломляюще сильным предсказанием было то, которое оказалось правильным; а именно, что белок является ацетилтрансферазой. Поэтому в этом случае общее предсказание выглядит правильным.

В общем, сервер ProKnow работает достаточно хорошо. Авторы протестировали его на невырожденном наборе белков с известной функцией и обнаружили, что около 70% функциональных аннотаций оказались правильными (Pal and Eisenberg 2005). Менее специфичные предсказания (например, гидролаза) являются более точными, чем более специфичные (например, лейциламинопептидаза). Точность предсказания была слегка увеличена за счет недавнего включения базы данных Prolinks, которая не использовалась в первоначальной версии, и увеличится еще больше, поскольку размер Prolinks растет.