Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Интегральные серверы для предсказания функции по структуре
ProKnow
Объединение предсказаний

Когда все процессы завершены, функции (т.е. термы по системе ГО), связанные с неоднократно встречающимися выявленными особенностями, объединяются с присвоением весов по теореме Байеса, что позволяет сделать оценку значимости каждого предсказанного терма. Рассматриваются только термы относящиеся к молекулярной функции и биологическим процессам, т.е. не принимаются во внимание термы, относящиеся к внутриклеточной локализации. Значимость каждого предсказанного терма отображается тремя числами. Первое - это байесовский вес, который соответствует вероятности, - от нуля до единицы, - того, что предсказание терма сделано правильно. Второе число - это ранг признака, показывающий, насколько надежным считается конкретное ГО-присваивание, чтобы быть на первом месте. Дело в том, что такие присваивания имеют разное происхождение: они могут быть сделаны куратором, получены прямым наблюдением, выведены на основании сходства структуры или последовательности и так далее. Этим вызвана и различная надежность, наиболее высокая для тех присваиваний, которые имеют прямые экспериментальные свидетельства в свою поддержку. Источник аннотации указан как код признака в данных ГО. Сервер ProKnow переводит каждый код признака в ранг для численной оценки его надежности, а ранги нескольких предсказаний при усреднении дают ранг признака. Третьим показателем значимости является число ключей, которое равно числу весов, использованных для расчета байесовского веса, и имеет отношение к тому, какое число методов сервера ProKnow внесло вклад в данное предсказание терма ГО.