Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Пространственные мотивы
Использование молекулярного докинга при аннотировании функции

В конце концов, специфичность к лиганду и каталитические возможности белка зависят от расположения атомов в его сайте связывания или активном центре. В то время как методы структурных мотивов стремятся напрямую установить связь между пространственными паттернами и функциями, можно использовать структуру белка для подбора вероятных лигандов, а затем с помощью получившегося предсказания специфичности связывания сделать выводы о молекулярной функции белка. В вычислительном докинге для каждого из большого числа низкомолекулярных органических соединений выполняется встраивание его структуры в сайт связывания белка и оценка комплементарности получившегося комплекса. Для каждого соединения могут быть рассмотрены сотни тысяч вариантов такого встраивания. Молекулы, получившие наивысшие оценки, считаются наиболее вероятными лигандами белка и является первыми кандидатами на экспериментальное тестирование.

Такой процесс вычислительного молекулярного распознавания может показаться очевидным, но на практике встречается со многими трудностями. Одна из них состоит в большом количестве метаболитов, которые может оказаться необходимым проверить в качестве возможных лигандов. Другая заключается в сложности быстрой, но достаточно точной оценки структурной комплементарности, позволяющей отличить истинные лиганды от схожих, но не связывающихся соединений. Для точной сортировки может понадобиться учет конформационной подвижности в процессе докинга, который еще больше увеличивает вычислительную нагрузку. Традиционно локирование большого числа соединений применялось для обнаружения соединений-лидеров, являющихся потенциальными лекарственными веществами. При аннотировании функции необходимость точной сортировки оказывается еще большей, чем в поиске лидеров, поскольку экспериментальный скрининг неизвестной каталитической активности гораздо более сложен, чем скриниг связывания, и поскольку цель состоит в аннотировании тысяч белков в автоматическом или полуавтоматическом режимах. Поиск лидеров же, напротив, сосредотачивается на одной или нескольких хорошо изученных мишенях.

Несмотря на эти трудности, такому подходу с недавних пор начали уделять значительное внимание (Macchiarulo et al. 2004; Paul et al. 2004; Kalyanaraman et al. 2005; Tyagi and Pleiss 2006; Favia et al. 2008). В двух опубликованных примерах предсказания функции с помощью молекулярного докинга (Hermann et al. 2007; Song et al. 2007), рассматриваемый белок был сначала опознан как представитель функционально разнородного надсемейства ферментов, что позволило сузить область поиска потенциальных субстратов. Однако в каждой работе использовались различные методы для получения точной сортировки продокированных молекул.

В первой работе рассматривалось семейство белков, которые, судя по информации об их последовательностях, могли быть отнесены к надсемейству енолаз, но их детальная функция надежно определена не была (Song et al. 2007). Все представители этого надсемейства катализируют отделение протона от углерода, примыкающего к карбоксильной группе, но их субстраты и реакции в целом сильно варьируются (Babbitt and Gerlt 2000). Поскольку для белков этого семейства нет экспериментально полученных структур, то для одного из представителей была построена модель на основании гомологии с наиболее схожим белком с известной структурой (идентичность последовательностей 35%) - аланинглутаматэпимеразой. N-сукциниламинокислотные рацемазы также локализованы возле неизвестного семейства в пространстве сходства последовательностей, поэтому в библиотеки для вычислительного и экспериментального скрининга были включены дипептиды и N-сукциниламинокислоты. Несмотря на в целом гораздо большее сходство с эпимеразами, чем с рацемазами, в параллельно выполненных экспериментальном изучении и in silico докинге было обнаружено, что белок катализирует рацемизацию N-сукцинилар- гинина и -лизина. Более того, хотя основанная на гомологии модель была построена по шаблону структуры аланинглутаматэпимеразы, докинг и оценка его решений с помощью подвижности боковых цепей и функций, основанных на физических принципах, подтвердила найденные экспериментально предпочтения среди N-сукциниламинокислот. Позже были получены кристаллографические структуры белка с обоими субстратами, которые показали значительное согласие с решениями докинга. Однако если бы в процессе докинга боковые цепи оставались неподвижными, то идентификация этих субстратов при докинге оказалась бы гораздо менее успешной (Song et al. 2007).

Во второй работе структура, определенная в рамках проекта по структурной геномике, могла быть отнесена к надсемейству амидогидро- лаз на основе типа укладки и наличия определенных высококонсервативных остатков в активном центре (Hermann et al. 2007). Однако эти остатки не позволяли понять, какая (если вообще какая-нибудь) из десятков реакций гидролиза, известных для данного надсемейства, могла бы катализироваться именно этим ферментом. Для докинга были отобраны только метаболиты, содержащие поддающиеся гидролизу фрагменты, такие как амидные, сложноэфирные и фосфоэфирные группы. Поскольку ферменты участвуют в катализе реакций, а не просто в связывании субстрата, авторы решили, что использование в докинге структур переходного состояния таких молекул должно дать лучшие результаты. Таким образом, для каждого метаболита были созданы структуры, имитирующие его переходное состояние: амиды и сложные эфиры были преобразованы в тетраэдрическую форму, фосфоэфиры в треугольно-бипирамидальную форму и так далее. Предварительные проверочные исследования показали, что использование в докинге таких высокоэнергетических форм улучшает результаты сортировки известных лигандов (Hermann et al. 2006).

В прогностическом исследовании (Hermann et al. 2007), было замечено, что многие соединения с высокой оценкой содержат адениновый фрагмент, в котором внециклический азот был преобразован в тетраэдрическую форму, как это происходило бы при дезаминировании. Экспериментально было установлено, что фермент катализирует дезаминирование трех из четырех протестированных аденин-содержащих метаболитов, но не производные цитозина, хотя наибольшее сходство последовательностей наблюдалось с хлоргидролазами и цитозиндезаминазами. Кристаллограффическая структура фермента в комплексе с одним из продуктов дезаминирования показала наличие тех взаимодействий, которые были предсказаны в докинге. Подтвержденное функциональное описание этого фермента позволило аннотировать еще несколько последовательностей, также содержащих характерные для такого активного центра остатки.

Следует заметить, что сужение пространства реакций до реакций гидролиза помогло сделать задачу решаемой, поскольку создание структур, имитирующих переходное состояние, значительно увеличило число молекул, предназначенных для локирования. При оценке учитывались стерический, электростатический и десольватационный вклады, но подвижность белка не рассматривалась.

Как методы, использующие структурные мотивы, так и молекулярный докинг при функциональном аннотировании сосредотачиваются скорее на локальной структуре, чем на структуре глобальной или на сходстве последовательностей. Будучи с вычислительной точки зрения более ресурсоемким, чем поиск совпадений структурных мотивов, докинг обладает возможностью экстраполяции на функции, не связанные с ранее описанными структурами; для рассматриваемого белка может быть предсказан “новый” субстрат.