Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Функциональное разнообразие в элементах упаковки и надсемействах
От способа укладки к функции
Определение способа укладки

6.2.1.1. Общие положения

Под способом укладки в общем случае понимают расположение главных элементов вторичной структуры белка, которое учитывает их взаимную ориентацию и топологические связи. Основная проблема, непосредственно вытекающая из этого общего определения, состоит в том, что не существует объективных правил, определяющих главные элементы вторичной структуры, которые необходимо рассматривать при определении способа укладки (Grishin 2001).

Одна из целей этой главы состоит в описании того, каким образом сведения о связях между белками, такие как информация об общем способе укладки, помогают распространять функциональные аннотации детально описанных белков на белки с неизвестными функциями. Как будет обсуждаться далее в разделе 6.3, процесс переноса аннотаций с одних белков на другие основан на предположении, согласно которому связанные в процессе эволюции (т.е., гомологичные) белки, как правило, имеют общие функциональные свойства. Однако белки, имеющие общий способ укладки, не обязательно являются гомологичными. В последнее время обсуждается вопрос о том, что различные белки могут приобретать один и тот же способ укладки независимо друг от друга в ходе конвергентной эволюции, поскольку количество способов укладки, приемлемых с физической точки зрения, ограничено (Russell et al. 1997).

Так, не установлено, связаны ли между собой эволюционно все белковые надсемейства, для которых характерен способ укладки, напоминающий структуру бочонка TIM (ß/a)8, поскольку четких доказательств в этом вопросе пока не обнаужено (Nagano et al. 2002).

6.2.1.2. Практические подходы

Существуют базы данных, в которых классификация белков представляет собой всеобъемлющую схему структурных связей. Ниже приводится практическое определение способа упаковки белковых структур, которое широко используется в некоторых базах данных. Как следует из определения, понятие способа упаковки применимо к доменам в большей степени, чем к полноразмерным белкам, однако определения домена для различных баз данных могут отличаться.

База данных САТН представляет собой иерархическую систему классификации структур белковых доменов (Orengo et al. 1997; Greene et al. 2007). Самый высокий уровень классификации определяет принадлежность белкового домена к одному из трех классов на основе его общего содержания во вторичной структуре. В пределах классов САТН домены относят к различным типам архитектуры, которые описывают взаимное расположение элементов вторичной структуры без учета возможностей их взаимодействия. Далее домены определенной архитектуры классифицируют по типу топологии в зависимости от того, каким образом элементы вторичной структуры соединены друг с другом. Именно этот топологический уровень наиболее близок к общему определению способа укладки, приведенному выше. На практике определение принадлежности домена к той или иной топологии САТН осуществляется автоматически с помощью программы выравнивания структур SSAP (Orengo and Taylor 1996) и разработанных опытным путем отсечек.

SCOP (от “the Structural Classification of Proteins”), так же как и САТН, является иерархической системой классификации структур белковых доменов (Murzin et al. 1995; Andreeva et al. 2008), однако уровни классификации в этих базах данных отличаются. Как и в САТН, самым высоким иерархическим уровнем в SCOP является структурный класс, однако в SCOP существует четыре различных класса, тогда как в САТН - три. Следующий уровень классификации - способ укладки; два белковых домена имеют один и тот же способ укладки, если им свойственны схожие элементы вторичной структуры, расположенные друг относительно друга схожим образом и связанные схожими топологическими связями. Это определение хорошо согласуется с определением топологии в САТН, но на практике принадлежность отдельных доменов к определенным иерархическим уровням в двух базах данных может отличаться, поскольку в каждом из определений присутствует элемент субъективности (а именно, какие элементы вторичной структуры считать основными), а также из-за разных протоколов, используемых для классификации доменов (автоматизированных в САТН и преимущественно настраиваемых вручную в SCOP).

Исключительно объективный метод определения способов укладки предложен в FSSP (от “families of structurally similar proteins” (Holm and Sander 1996b). В FSSP для ряда представительных и неизбыточных структур PDB выполнялись парные выравнивания, при этом использовалась программа для структурного выравнивания DALI (Holm and Sander 1993). Полученные таким образом численные показатели парного выравнивания структур использовали при иерархической кластеризации, с помощью которой создавали так называемое дерево структурной укладки. Семейства структурной укладки определяли автоматически, разделяя полученное дерево на различных уровнях подобия.

6.2.1.3. Изменение парадигмы

В общем случае в процессе эволюции структура белка является более консервативной, чем его последовательность, что отражено во множестве общих структурных характеристик белков. По мере того, как в середине 1990-ых годов росло количество пространственных структур белков, всё острее становилась необходимость появления систем структурной классификации, с помощью которых можно было извлекать из анализа структурных данных значимую информацию. Такая ситуация привела к появлению описанных выше иерархических систем классификации белковых структур. Общие структурные мотивы, такие как бочонки (ß/a)8 или четырехспиральные пучки, встречаются в белках, последовательности которых не имеют общих черт. Осмысление этого факта привело к формированию представлений о способах пространственной укладки в белках, которые изложены выше. До недавнего времени под способами пространственной укладки белков понимали периодически повторяющиеся общие структурные мотивы, которые случайным образом разделяют структурное пространство белков. В рамках этой теории подразумевается, что пространство укладки дискретно, т.е.: а) каждый белок характеризуется уникальным способом укладки, который объединяет его со схожими белками и отделяет от большинства несвязанных белков (несмотря на объяснение существования аналогичных способов укладки, см. раздел 6.2.2.1); б) каждый способ укладки обладает собственными структурными характеристиками и представляет собой отдельную структурную группу, не перекрывающуюся с другими группами (Kolodny et al. 2006).

Однако по мере увеличения количества доступных структурных данных, в особенности за счет успехов структурной геномики, представления о способах укладки белков меняются, и пространство укладки представляется скорее непрерывным, чем дискретным (Harrison et al. 2002). В последнее время всё более широкое распространение получает идея, согласно которой гомологичные белки могут сворачиваться различными способами (Grishin 2001; Kolodny et al. 2006), а для некоторых белков характерно множество непостоянных мотивов укладки, при этом мотив в данный момент времени определяется условиями, в которых существует белок (Andreeva and Murzin 2006). Все это имеет свои последствия при учете способов укладки в ходе исследования функций белков. Главный аргумент в пользу учета способов укладки при исследовании функций состоит в том, что белки, обладающие схожей укладкой, зачастую обладают также отдаленной гомологией, которую нельзя установить другими методами исследования, а также в том, что гомологичные белки, как правило, выполняют схожие функции (Moult and Melamud 2000). Это неизбежно следует из того факта, что при неопределенной связи между способом укладки и гомологией связь между способом укладки и функциями, вероятно, также будет неопределенной. Однако результаты последних исследований, полученные при использовании совокупности структурных данных, доступных в САТН, свидетельствуют о том, что большинство способов укладки структурно согласованы и заметно отличаются от остальных способов укладки (Cuflf et al., рукопись в стадии подготовки). Действительно, как будет продемонстрировано позднее, подобие способов укладки может способствовать установлению подобия функций изучаемых белков (Martin et al. 1998).