Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Примеры: предсказание функции структур, полученных в проектах по структурной геномике
Коллективное аннотирование

Большому количеству белковых структур, расшифрованных в проектах по структурной геномике, не соответствует, к сожалению, столь же большое количество публикаций. Фактически, в настоящий момент опубликование структуры видится как одно из самых узких мест на отлаженном пути высокопроизводительной расшифровки структур (Rigden 2006). Это не говорит об отсутствии заинтересованности в публикациях, плохом выборе белка или отсутствии интересных структур. Скорее это говорит о том, что многим проектам не хватает такой неотъемлемой стадии, как быстрое опубликование своих результатов и предоставление доступа к ним для общественности. Это означает, что предсказание или экспериментальное определение функции, что часто бывает сопряжено с большими затратами времени, выполняется после появления структуры и часто в сотрудничестве с другими лабораториями, специализирующимися на конкретном изучаемом белке. Одним из способов исправления ситуации является сокращение времени, затрачиваемого на эти эксперименты, путем разработки высокопроизводительных тестов для скрининга ферментативной активности (Kuznetsova et al. 2005). Такие тесты оказались успешными (Proudfoot et al. 2004), но ограничения, связанные с реализацией ряда ключевых ферментативных реакций, означают, что предлагаемый способ пока не может быть расширен для определения любой функции. Другой подход к улучшению аннотации белков, являющихся объектами изучения структурной геномики, состоит в изучении возможности коллективного аннотирования этих белков с использованием технологии wiki (Giles 2007; Mons et al. 2008).

Одной из первых попыток реализации этого подхода стал проект TOPSAN (The Open Protein Structure Annotation Network, Открытая сеть по аннотированию белковых структур), стартовавший в Объединенном центре по структурной геномике (JCSG) и объединяющий сейчас данные для структур, полученных в Центре по структурной геномике на Среднем Западе (MCSG) и Исследовательском центре по структурной геномике в Нью-Йорке (New York Structural GenomiX Research Center, NYSGXRC). Проект основан на технологии wiki (http://www.topsan.org/), то есть доступен для просмотра любому пользователю, но заполнять страницы могут только зарегистрированные пользователи. Идея, заложенная в TOPSAN, состоит в том, что коллективное аннотирование глобальным сообществом экспертов, каждый из которых специализируется в своей конкретной области, может обеспечить гораздо более разностороннюю информацию обо всех доступных белках с известной структурой, чем та, которую смог бы когда-либо обеспечить отдельный специалист или небольшая их группа. Страницы с аннотациями будут, таким образом, предлагать широкой общественности сочетание аннотаций, созданных автоматически, и тех, что составлены экспертами. Начальная версия вышла за рамки прототипа и теперь расширяется с намерением включить все мишени из проекта по белковым структурам (Protein Structure Initiative, PSI).

Более масштабным проектом является PDBWiki (http://pdbwiki.org/), который был создан в августе 2007 года в Группе структурной протеомики в Институте молекулярной генетики имени Макса Планка. В настоящее время проект охватывает все структуры в базе данных PDB, а на каждой странице наряду с основной информацией о белке представлены ссылки на другие базы данных и ряд средств для анализа последоваельности и структуры.

Следующим шагом стала новая энциклопедия, основанная на технологии wiki и базе данных PDB, и названная Proteopedia (http://www.proteopedia.org/). Первостепенная цель этой энциклопедии состоит в представлении структурной и функциональной информации о макромолекулах в таком виде, чтобы она была легко доступна студентам, ученым и общественности. Каждая структура в PDB имеет свою собственную страницу, заполняемую с использованием информации из базы данных ОСА (Prilusky 1996) и других источников. Есть ряд существенных различий между Proteopedia и PDBWiki, важнейшим из которых является уникальная система ссылок в тексте на сцены, создаваемые в апплете Jmol viewer (Proteopedia представляет полностью интерактивное изображение структуры белка, а не статическое). Используя эту систему, любой редактирующий страницу может легко создавать сцены, чтобы выделить ключевые области белка или ограничить взгляд областью, обсуждаемой в тексте. Это делает Proteopedia ресурсом большим, нежели простой набор статических страниц для отображения информации, создавая дополнительный уровень взаимодействия, который можно использовать для более наглядного представления идей и освещения интересных областей в структуре белка. Другой уникальной чертой сайта является отсутствие анонимных правок и полное имя пользователя сохраняется в истории правок страницы. У такого подхода есть еще одно преимущество: у пользователей может быть свои доступные для просмотра, но не доступные для редактирования области в системе. Это позволяет создание тематических статей или статей-примеров, которые остаются постоянными и таким образом могут использоваться как в обучающих целях, так и в целях коллективного аннотирования.