Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Пространственные мотивы
Обзор методов
Интерпретация результатов

Существует большое число веб-серверов, позволяющих сравнить рассматриваемую структуру с базами данных структурных мотивов (Табл. 8.1). Какие выводы можно сделать о функции белка, если в его структуре будет обнаружен какой-либо мотив? При определении, является ли это совпадение значимым, и если да, какой смысл оно за собой несет, необходимо рассмотреть несколько вопросов.

Предполагаемая функция зависит от того, как был получен мотив. Если мотив представляет собой набор остатков, для которых экспериментально показано, что они важны для выполнения белком конкретной функции, то обнаружение в структуре рассматриваемого белка такого мотива позволяет предположить, что этот белок также может выполнять эту функцию. Аналогично, обнаружение мотива, полученного на основании структур многочисленных белков, выполняющих схожую функцию (положительные примеры), позволяет предположить о выполнении этой же функции, особенно если мотив был создан для исключения отрицательных примеров. Однако то, какая функция будет приписана структуре, зависит от критериев принадлежности структур к положительным примерам. Например, если все положительные примеры связывают аденозин, но катализируют разнообразные реакции, то обнаружение в рассматриваемой структуре их общего мотива будет подразумевать связывание аденозина, но не обязательно аденозиндеаминазную активность. Если набор структур, являющихся положительными примерами, состоит из представителей надсемейства по классификации SCOP, то обнаружение мотива в рассматриваемом белке будет означать, что он также принадлежит к этому надсемейству, однако нельзя будет предположить что-то более конкретное о его функции.

В идеале набор положительных примеров для поиска мотива должен быть по возможности разнообразным при сохранении у его членов некого общего свойства, а отрицательные примеры должны быть по возможности схожи со положительными примерами, но при отсутствии этого свойства. На практике наборы положительных и отрицательных примеров могут быть не идеальны, и часть или все полученные структурные мотивы могут все-таки отражать общее происхождение или совпадение, а не общую функцию.

Интерпретация обнаруженных в структуре мотивов, полученных с помощью метода “единичных структур”, довольна субъективна. Как и в случае последовательностей, аннотирование рассматриваемой структуры осуществляется по аналогии с белком, который является источником мотива, совпавшего наилучшим образом. Обнаружение мотива, соответствующего сайту связывания, может быть традиционно интерпретировано как предсказание специфичности связывания, а кроме того, можно судить (верно или неверно) и о других аннотациях - каталитической активности, принадлежности к какому-либо семейству и надсемейству. Следует отметить, что само по себе близкое расположение к лиганду не гарантирует, что остаток важен для связывания или катализа, поскольку он мог появиться там в результате мутации. Помимо использования остатков, расположенных рядом с лигандом, другим способом получить мотив из единичной структуры является использование аннотаций, которые приведены в PDB файле (строки SITE). Хотя эти аннотации предназначены для перечисления остатков, образующих сайты связывания, смысл обнаружения такого мотива также неясен, поскольку нет строгих критериев того, какие остатки должны быть перечислены. Кроме того, многие PDB файлы лиганд-связывающих структур не содержат строк SITE вообще.

Таблица 8.1. Веб-серверы для поиска и сравнения структурных мотивов

Название и URL	Функция сервера	База данных структурных мотивов¹¹
Catalytic Site Atlas (CSA) www.ebi.ac.uk/thomton-srv/Databases/cgi-bin/CSS/makeEbiHtml.cgi?file=form.html	Сравнивает рассматриваемую структуру с БД мотивов с помощью программы JESS, оценивает значимость	Мотивы из альфа углерод ных/бета-углеродных и функциональных атомов для 147 хорошо изученных семейств ферментов; также доступна для скачивания
fiinClust www.pdbfim.uniroma2.it/Funclust	С помощью программы Query3D определяет мотивы, общие для трех или более структур, при общем числе загружаемых структур до 20	Нет баз данных
GASPSdb www.gaspsdb.rbvi.ucsf.edu	Используя программу RIGOR⁶, сравнивает рассматриваемую структуру со структурными мотивами, присутствующими в SCOP и ГО, оценивает значимость	Мотивы из альфа углеродов и геометрических центров боковых цепей: 4385 мотивов, представляющих 272 молекулярные функции по системе ГО, 3599 мотивов, представляющих 186 надсемейств и 137 семейств по классификации SCOP, 4581 мотивов, представляющих 376 групп, в которых белки как входят в одинаковые надсемейства по классификации SCOP, так и имеют одинаковую молекулярную функцию по системе ГО
PAR-3D www.sunserver.cdfd.org.in:8080/protease/PAR_3D	Сравнивает рассматриваемую структуру с мотивами, представленными в виде расстояний между точками и диапазонами углов.	Мотивы из альфа-углеродных и бета-углеродных атомов для 6 классов протеаз и 10 ферментов гликолитического пути; Мотивы из альфа-углеродных, бета-углеродных атомов и псевдоатомов боковых цепей для металл-содержащих сайтов связывания, состоящих из трех или четырех остатков.
pdbFun www.pdbfun.uniroma2.it	Сравнивает конкретный образец и целевые наборы остатков, используя программу Query3D	более 12 млн отдельных остатков, выборки из которых могут быть заданы с помощью булевских комбинаций дескрипторов
PDBSiteScan www.mgs.bionet.nsc.ru/cgi-bin/mgs/fastprot/pdbsitescan.pl?stage=0	Сравнивает рассматриваемую структуру со всеми мотивами в БД PDBSite или их частью	36273 мотива, образованные атомами основной цепи и основанные на аннотации в строке SITE единичных pdb-структур или интерфейсах этих структур с другими белками, РНК или ДНК
PINTS www.russell.embl.de/pints Результаты недельной давности: www.russell.embl.de/pints-weekly	Сравнивает рассматриваемую структуру с мотивом из базы данных, задаваемый пользователем мотив с БД белковых стpуктур, или два белка друг с другом; оценивает значимость	Лиганд-связывающие и аннотированные в строке SITE мотивы, состоящие из точек боковой цепи полярных остатков
ProFunc www.ebi.ac.uk/thomton-srv/databases/profunc	Множественный поиск, включающий поиск мотива с использованием программы JESS: рассматриваемая структура целиком в БД мотивов, фрагменты рассматриваемой структуры в БД полных цепей; оценивает значимость	Активные центры мотивов, взятых из БД CSA, 13057 лиганд-связывающих и 1200 ДНК-связывающих мотивов из единичных структур, 11750 полных цепей; остатки представлены атомами боковых цепей, небольшие остатки также в виде одного или нескольких атомов основной цепи.
ProKnow www.Proknow.mbi.ucla.edu	Множественный поиск, включающий поиск мотива с помощью программы RIGOR, результатом является аннотация по системе ГО	10230 мотивов из структур, аннотированных по системе ГО, или 7819 мотивов, если исключить электронные аннотации
Protemot www.protemot.csbb.ntu.edu.tw	Сравнивает рассматриваемую структуру со всеми лиганд-связывающими мотивами или каким-то их подклассом (например, только ферменты)	2362 мотива сайтов связывания из альфа-углеродных атомов, 1051 из которых относятся к ферментам
SuMo www.sumo-pbi1.ibcp.fr Коммерческий сайт: www.medit.fr/products-page2-med-sumo.html	Сравнивает рассматриваемую структуру, цепь или лиганд-связывающий сайт с БД структур или только их лиганд-связывающих сайтовб	34210 лиганд-связывающих сайтов в добавление к полным структурам, описываемым как пространственные паттерны функциональных групп

^а Из публикаций, веб-сервисов или информация от авторов; ссылки могут быть устаревшими.

^б Только для некоммерческого использования.

Другим обстоятельством, заслуживающим рассмотрения, является строгость соответствия между мотивами, которая зависит от размера мотива и его представления, а также от количественных критериев и численных пороговых значений, используемых при поиске соответствий. Представление мотивов, опирающееся лишь на альфа-углеродные атомы, менее специфично, чем то, которое включает в себя и атомы боковых цепей. Структурные мотивы, учитывающие небольшое число остатков, также менее специфичны. Строгие параметры соответствия (сопоставление остатков только идентичных типов, низкое пороговое значение для СКО) могут ограничить результаты близкородственными белками, даже если при использовании более мягких критериев могли бы быть получены осмысленные соответствия с более удаленными белками.

Большинство методов имеет оценочные функции для ранжирования хитов и определения качества соответствия. Например, значения СКО указывают на степень геометрической близости между точками структурного мотива и соответствующими точками в структуре. СКО является подходящей мерой для ранжирования мотивов по степени соответствия с эталонным мотивом, но этот критерий неприменим при рассмотрении мотивов различных размеров. Кроме того, некоторые мотивы более склонны к соответствию друг с другом просто потому что они включают большее число одинаковых остатков. Для учета этих вопросов и обеспечения лучшего ранжирования хитов, некоторые методы рассчитывают величины статистической значимости (англ. P-value) или математического ожидания (англ. E-value). Однако необходимо иметь ввиду некоторые ограничения в их применимости, так как эти величины зависят от имеющихся фундаментальных предположений о статистической модели и от данных, используемых при параметризации этой модели.

Независимо от того, каким образом был получен структурный мотив, он может быть протестирован на некоторой выборке структур. Когда эта выборка включает в себя достоверные положительные и отрицательные примеры, результаты тестирования могут быть выражены в терминах чувствительности, т.е. способности отбирать положительные примеры, и специфичности, т.е. способности исключать отрицательные примеры. Когда выборка включает лишь отрицательные примеры, то результирующее распределение по СКО может быть использовано для оценки статистической значимости соответствий этому мотиву. Применимость этих производных величин зависит от в достаточной степени обширной и представительной выборки.

Может быть полезен консенсусный подход, когда несколько хитов к родственным мотивам или аналогичные результаты, полученные с помощью различных программ и баз данных, могут приводить к общему предсказанию.

Наконец, необходимо обращаться к здравому смыслу. Например, возможен случай, когда есть хорошее соответствие мотиву какого-нибудь активного центра, но при этом нет кармана для связывания субстрата. Кроме того, статистическая значимость и биологическая значимость - это не одно и то же; биологически значимый мотив может не быть оценен как статистически значимый по сравнению с мотивом, который не имеет биологической ценности. Таким образом, перед применением мотивов для суждения о функции или какой-либо другой характеристике белка, целесообразно проверять соответствия визуально и оценивать их с помощью биологических значимых критериев.

Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Пространственные мотивыОбзор методовИнтерпретация результатов

Пространственные мотивы
Обзор методов
Интерпретация результатов