Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Методы биоинформатики для изучения структуры и функций неупорядоченных белков
Предсказание функций БПН
Корреляция модели неупорядоченности и функции

Как следует из соображений, изложенных выше, до всестороннего и достоверного предсказания функций БПН еще очень далеко, и для достижения этой цели сделаны лишь первые шаги. В следующем разделе будут рассмотрены те несколько методов, которые могут пролить свет на функции БПН, еще не описанные в экспериментах. Функциональная корреляция общей модели по неупорядоченности (Lobley et al. 2007), основанное на последовательности предсказание коротких линейных мотивов с помощью различных алгоритмов (Davey et al. 2006; Neduva and Russell 2006), прогнозирование СМОР в БПН/ОПН (Mohan et al. 2006; Vacic et al. 2007) и сочетание информации о последовательности с неупорядоченностью (Iakoucheva et al. 2004; Radivojac et al. 2006) представляют собой примеры обоснованного подхода к оценке функций неизвестной области неупорядоченного белка.

Для поиска связи между общей моделью неупорядоченности и функцией белка (Lobley et al. 2007), описанной в стандартных категориях генной онтологии (ГО), Джонс и соавт. выбрали прямой подход. Впервые было обнаружено, что дескрипторы неупорядоченности, связанные как с месторасположением, так и с длиной, коррелируют с функциональными категориями, имеющими отношение к передаче сигналов и регуляции транскрипции. Использовались аннотации молекулярной функции и биологического процесса. Для дескрипторов месторасположения отмечен ряд тенденций, связанных с категориями ГО, например, повышенный уровень в середине белка в регуляторе транскрипции, при связывании ДНК и в факторе транскрипции РНК pol II, в С-конце активатора фактора транскрипции, репрессора фактора транскрипции и фактора транскрипции, а также в N-конце белков, аннотируемых с калиевыми каналами. Для дескрипторов длины показаны еще более выраженные связи с функцией, чем для дескрипторов месторасположения. Так, неупорядоченные области размером более 500 остатков в избытке представлены в категориях, связанных с транскрипцией, тогда как более короткие области длиной около 50 остатков или менее широко представлены в белках, связывающих ионы металлов, а также в белках, выполняющих функции ионных каналов и регуляторные функции ГТФаз. Обнаруженные связи можно использовать для улучшения качества прогнозов функций белков: в случае применения метода прогнозирования на основе метода опорных векторов к 26 категориям ГО прогнозы для 11 категорий биологических процессов и 12 категорий молекулярных функций были более высокого качества, что являлось результатом учета свойств неупорядоченности. В целом, учет неупорядоченности заметно улучшает качество прогнозов функций белков, при этом более значимые улучшения наблюдаются для категорий биологических процессов по сравнению с молекулярными функциями.