Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Предсказание функции белков на основе их теоретических моделей
Практическое применение
Комплексы белков

Если системная биология, в соответствии с которой те или иные масштабные наборы данных объединяются в смысловое целое, стремится однажды достичь успеха, то необходимо полное понимание сложных сетей белок-белковых взаимодействий, которые существуют в клетке. Таким образом, с её стороны есть большая выгода в добавлении предсказаний, полученных сравнительным моделированием, в арсенал экспериментальных и вычислительных методов для предсказания белок-белковых взаимодействий (Aloy and Russell 2006). Принцип очень простой: при заданной известной структуре комплекса белка А с белком X, именно анализ потенциального комплекса белка В с белком У (где В гомологичен А, а Y гомологичен X) позволяет предположить, что это взаимодействие будет иметь место in vivo (Aloy and Russell 2002). Ранние методы в этой области оценивали пригодность интерфейса, заимствуя потенциалы парных взаимодействий из методов протягивания и анализируя известные контакты в структуре А-Х после выравнивания последовательностей В и А и последовательностей Y и X. В настоящее время анализ такого рода можеть быть выполнен с помощью ряда веб-серверов, включая InterPreTS (Aloy and Russell 2003) и MULTIPROSPECTOR (Lu et al. 2002). В последующих работах моделирование белкового комплекса выполняли явным образом и снова использовали потенциалы взаимодействия, чтобы провести различие между истинными и ложными взаимодействиями (Davis et al. 2006). Заслуживает внимания интересное масштабное приложение такого типа предсказаний (Davis et al. 2007), которое было выполнено для белков человека и белков из геномов десяти патогенных организмов, ответственных за запущенные заболевания. Геномы патогенов и хозяина были сперва просканированны в поисках белков, гомологичных тем белкам, чьи взаимодействия известны. Если такая структурная информация о взаимодействии была недоступна, то процесс продолжали, применяя простые функции для оценки сходства последовательностей. Однако, этот подход позволил сделать лишь небольшое число предсказаний, поскольку были использованы строгие критерии для их надежности.

Более интересным и значительным было явное моделирование потенциально взаимодействующих партнеров по шаблону белкового комплекса. Полученные модели комплексов были оценены с использованием статистических потенциалов, и, получившие положительную оценку, были допущены к следующему хитроумному фильтру. Этот фильтр использовал известную информацию о тканевой и внутриклеточной локализации и функции взаимодействующих белков, чтобы исключить из рассмотрения те взаимодействия, которые не могли бы произойти in vivo. Таким образом, в качестве кандидатов для взаимодействия с белками Mycobacterium leprae были отобраны только белки, экспрессируемые в коже, лимфатических узлах или легких хозяина. Патогенные белки также должны были подходить под специфические биологические критерии. Например, белки М. leprae должны были иметь подходящую аннотацию в системе ГО (например, указание на патогенность) или быть аннотированными как внеклеточные или расположенные на поверхности. После этого фильтра число предсказываемых взаимодействий оказалось в пределах от 0 до 1 501 в зависимости от патогена.

И хотя в распоряжении авторов методики было не так много известных взаимодействий для её тестирования, им удалось предсказать 4 из 33 взаимодействий, описанных к настоящему времени. В остальных случаях для моделирования взаимодействий не нашлось подходящего шаблона, что дает повод считать недостаток шаблонов виновным в малом количестве описанных взаимодействий (Davis et al. 2007). Интересно, что одно предсказание было экспериментально подтверждено: метод предсказал взаимодействие фальципаина-2 и цистатина (PDB код lyvb), основываясь на более ранней структуре катепсина-Н в комплексе со стефином A (PDB код 1nb3) (Рис. 12.2). Два эти фермента имеют около 24% идентичности, их ингибиторы идентичны лишь на 11 %, поэтому успех предсказания при столь низкой схожести последовательностей и заметном различии в структурах (Рис. 12.2) хорошо характеризует возможности метода.