Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Функциональное разнообразие в элементах упаковки и надсемействах
Определение функций

Бенуа X. Дессейли, Кристина А. Оренго

С первыми успехами структурной геномики стало доступно всё увеличивающееся число пространственных структур белков с неизвестными функциями. Тем не менее, по-прежнему спорным остается вопрос, насколько информация о структуре способствует пониманию функций. В настоящей главе рассматривается значение методов, которые позволяют на различных уровнях (обычно элемент укладки и надсемейство) устанавливать структурные связи между белками, с тем, чтобы затем осуществлять перенос функциональных аннотаций. Прежде всего, исследовано разнообразие функций белков, имеющих общий элемент укладки. Определение элемента укладки в некоторых случаях может служить подсказкой при определении функциональных свойств. Однако показано, что разнообразие функций, соответствующих одному элементу укладки, может быть весьма широко, и для некоторых многообразных элементов укладки (например, суперфолдов) получаемая таким образом информация о функциях оказывается очень скудной. Далее, проанализировано разнообразие функций среди белков одного надсемейства (гомологичных белков), поскольку данные о структуре могут помочь при определении гомологии в отсутствие сходства последовательностей. Обсуждаются эволюционные основы и механизмы, породившие существующее функциональное многообразие связанных между собой белков. Рассмотрены полезные инструменты для взаимосвязанного анализа структуры, функций и эволюции белков.

В. Н. Dessailly and С A. Orengo*

Department of Structural and Molecular Biology, University College London,

London WC1E 6BT, UK

*e-mai1:[email protected]

Прежде, чем обсуждать, каким образом определение связей на уровне элемента упаковки или надсемейства может помочь при определении функций белка, необходимо дать четкое определение термину “функция” в настоящей главе. Это необходимо в том числе и для того, чтобы наметить аспекты функций, наличие которых можно наилучшим образом предполагать на основе структурной информации.

Функция - относительно расплывчатое понятие, охватывающее множество различных аспектов активности белка. Более того, аспекты, подразумеваемые под этим термином, изменяются в зависимости от конкретной области науки о белках. Так, физиолог, вероятно, описал бы функцию белка в терминах его влияния на глобальный фенотип (например, “инициатор гибели клеток”), тогда как биохимик, как правило, определяет функцию исследуемого белка на основе характерных для него молекулярных взаимодействий или каталитической активности (например, “серин-треониновая протеин-киназа, взаимодействующая с рецептором”). Из-за этих различий в использовании термина весьма сложно дать универсальное и широко применимое определение функции белка.

Однако разрабатывать универсальную формулировку вовсе не обязательно. Консорциумом по генной онтологии (ГО) предложена общая схема, с помощью которой можно определить и, что более важно, классифицировать функции белков универсальным образом (The Gene Ontology Consortium 2000). В ГО функции белка рассматриваются с трех различных позиций, а затем с каждой из позиций дается независимое определение. Согласно ГО, клеточный компонент описывает биологические структуры, к которым принадлежит белок (например, ядро или рибосома); биологическая цель отвечает целям или путям, в которых принимает участие белок (например, метаболизм, передача сигналов или дифференцировка клеток); молекулярная функция белка - совокупность функций, которые он может выполнять (например, катализ или транспорт).

Информация о пространственной структуре белков преимущественно помогает понять каталитические механизмы и предположить возможные взаимодействия с другими молекулами - оба эти аспекта принадлежат к категории молекулярных функций. В результате, в случаях, когда речь идет о связях между структурой и функциями (как в этой главе), рассматривается главным образом категория молекулярных функций.

Для описания молекулярных функций белков существует ряд баз данных и систем аннотации (см. таблицу 6.1), которые весьма полезны при изучении структурно-функциональных связей, в особенности, на автоматической основе. Вероятно, старейшим методом описания молекулярных функций белков является схема нумерации Комиссии по ферментам (КФ, ЕС, от “Enzyme Commission”), в которой ферментативные реакции классифицированы иерархически. Используется четырехразрядная система, в которой каждый уровень все более подробно описывает особенности реакции, от общего типа каталитической активности (оксидоредуктаза, гидролаза и т.д.) до специфических молекул, выступающих в роли субстрата (Nomenclature Committee of the IUВМВ 1992). Для преодоления давно известного ограничения классификации КФ в последнее время были созданы две новые базы данных для классификации ферментов и их реакций: EzCatDB (от “Enzyme catalytic-mechanism Database”) (Nagano 2005) и MACiE (от “Mechanism, Annotation and Classification in Enzymes”) (Holliday et al. 2007). Обе базы данных содержат описание и классификацию механизмов ферментативных реакций, а не информацию о реакциях как таковых. Это связано с тем, что в последнее время все большее одобрение получает идея, согласно которой классификацию, в основу которой положены реакции, (такую как система КФ) не всегда можно использовать в качестве классификации соответствующих ферментов (O’Boyle et al. 2007). В дополнение к этим базам данных, Атлас каталитических сайтов содержит подробную информацию о специфических аминокислотных остатках, непосредственно задействованных в механизмах катализа, для ферментов известной структуры (Porter et al. 2004). Некоторые базы данных предоставляют дальнейшее описание всех белковых остатков, участвующих в связывании биологически важных молекул, таких как субстраты и кофакторы (Lopez et al. 2007; Dessailly et al. 2008). К числу других широко используемых систем аннотации белковых функций принадлежат KEGG и FUNCAT. KEGG первоначально был нацелен на описание метаболических путей и сетей биологических реакций, а в настоящее время представляет собой более широкую систему классификации биологических функций (Kanehisa et al. 2008). FUNCAT (от “the Functional Catalogue”) классифицирует белковые функции и строит уникальное иерархическое дерево (Ruepp et al. 2004).

Таблица 6.1. Ссылки и краткие описания интересных баз данных и инструментов, упомянутых в тексте

Название

URL

Описание

САТН

http://cathwww.biochem.ucl.ac.uk/

Структурная классификация белков

SCOP

http://scop.mrc-lmb.cam.ac.uk/scop/

Структурная классификация белков

SFLD

http://sfld.rbvi.ucsf.edu/

Функциональная классификация надсемейств ферментов

PROCOGNATE

http://www.ebi.ac.uk/thomton-srv/databases/procognate/index.html

Картирование доменов по их известным лигандам

Gene Ontology

http://www.geneontology.org

Регулируемый словарь белковых функций

ЕС

http://www.chem.qmul.ac.uk/iubmb/enzyme/

Классификация ферментативных реакций

EzCatDB

http://mbs.cbrc.jp/EzCatDB/

База данных каталитических механизмов ферментов

MACiE

http://www.ebi.ac.uk/thomton-srv/databases/MACiE/

База данных ферментативных реакций

KEGG

http://www.genome.jp/kegg/

Объединенное представление генов, генных продуктов и метаболических путей

FUNCAT

http://mips.gsf.de/projects/funcat

Схема аннотирования функций белков

DALI

http://ekhidna.biocenter.helsinki.fi/daliserver

Структурное выравнивание

FATCAT

http://fatcat.bumham.org/

Гибкое структурное выравнивание

SSM

http://www.ebi.ac.uk/msd-srv/ssm/

Структурное выравнивание по совпадению вторичной структуры

CATHEDRAL

http://www.cathdb.info/cgi-bin/CathedralServer.pl

Алгоритм выявления известных типов укладки в структурах белков

Как и большинство баз данных такого рода, и KEGG, и FUNCAT содержат информацию преимущественно о биологических процессах, в которых участвуют описываемые белки, а не о разновидностях их молекулярной активности, однако обе эти базы данных содержат сведения, которые могут оказаться весьма полезны при исследовании свойства, которое в системе ГО принято называть молекулярной функцией.