Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Примеры: предсказание функции структур, полученных в проектах по структурной геномике
Заключение

Группами по структурной геномике было определено огромное количество структур, которые обогатили нашу сокровищницу пространственных структур белков. Однако из-за высокой скорости получения и опубликования этих структур, что являлось требованием проекта, большая доля структур почти или вовсе не имеет информации о функции. Возможность предсказания функции белка по его последовательности и структуре являлось для специалистов по биоинформатике чем-то вроде Святого Грааля, поэтому за годы работы в этом направлении было разработано большое разнообразие методов. Каждый из этих методов имеет свои “за” и “против”, и многочисленные примеры исследовательских работ ярко показывают, как один подходящий метод может дать биологическое понимание там, где другие методы потерпели неудачу. В настоящее время ни один из методов не является успешным на 100%, поэтому для дальнейшего прогресса в нашем понимании необходимо продолжать разработку новых средств структурного анализа и предсказания функции.

Несколько попыток провести масштабный анализ возможности предсказания функции белка по его структуре окончились с переменным успехом, но есть ряд важных задач в этой области, которые требуют решения. Одной из главных задача, возникающих при разработке методов предсказания функции по структуре, является отсутствие набора данных, которые могли бы стать “золотым стандартом” при проверке этих методов. Как следствие, каждая группа разработчиков вынуждена создавать свой набор данных для тестирования, что приводит к сложностям при сравнении различных методов. Другим важным препятствием, которое должно быть преодолено, является задача сравнения методов предсказания по структуре и методов предсказания по последовательности. Хотя и не всегда невозможное, удаление информации из баз данных последовательностей и профилей, полученных на их основе, является гораздо более сложной задачей. Это применимо лишь к апостериорным видам анализа (как, например, выполненный Watson et al. 2007), но если бы были сохранены все предсказания функции белка, сделанные на момент появления его структуры, и в будущем проанализированы, то проблема была бы решена. Такая работа уже начата с использованием сервера ProFunc, результаты предсказания которого для структур, полученных в MCSG, сохраняются для дальнейшего анализа и сравнения. Все эти вопросы нетривиальны и потребуют внимания, если создаваемые наборы данных должны будут использоваться в будущем для оценки и сравнения методов. Чтобы увеличить вероятность обнаружения правильной функции, упор делается на создание комбинированных методов и использование всей доступной информации. Объединение существующих биоинформатических методов стало прямым ответом на большое число белков, почти или совсем не имеющих функциональной аннотации. Один из трудных вызовов, возникающих на пути предсказания функции белков, состоит в учете информации из всех областей биологической науки, и поскольку количество доступной информации растет, то наметившийся уклон в сторону проектов коллективного аннотирования, вероятно, окажет главныю помощь в предоставлении более глубокого биологического понимания.

Благодарности. Авторы хотели бы поблагодарить Романа Ласковски (Roman Laskowski) и Вики Шнайдер (Vicky Schneider) за их ценные замечания к этой главе.