Принципы структурной организации белков - Г. Шульц 1982

Предсказание вторичной структуры по аминокислотной последовательности

В первом приближении вторичная структура сегмента цепи является функцией входящих в его состав аминокислот. Число известных аминокислотных последовательностей намного превышает число известных трехмерных структур (см., например, Атлас Дейхофа [20]). Поскольку в порядке расположения аминокислот заложена полная информация о структуре белка (разд. 1.2, а также работа [177]), то в принципе можно установить пространственное строение по аминокислотной последовательности без рентгеноструктурного анализа. Первым шагом в этом направлении могло бы послужить более тщательное исследование взаимосвязи между двумя низшими уровнями структурной организации белков (рис. 5.1), т. е. между аминокислотной последовательностью и вторичной структурой. Хотя такая организация и носит иерархический характер, однако иерархия здесь далеко не однозначна в том смысле, что образование вторичной структуры в данном сегменте полипептидной цепи зависит не только от аминокислотной последовательности сегмента, но и от влияния других сегментов, удаленных от исходного по цепи*.

Первые данные о взаимосвязи получены на синтетических гомополимерах. Первая корреляция между аминокислотной последовательностью и вторичной структурой была установлена Блоутом и сотр. [328]. На основе опытов с синтетическими гомополимерами — полипептидами, поли-Glu, поли-Lys и т. д., они исследовали способность к образованию и к нарушению а-спиральной структуры аминокислотных остатков семи типов (табл. 6.1). К спиралеобразующим были отнесены остатки, которые принимали а-спиральную конформацию, а к спираленарушающим — те, которые такую конформацию не принимали.

* В таком аспекте рассматриваемая функциональная зависимость в известной мере сходна с преобразованием Фурье, в котором все точки основного пространства вносят вклад в данную точку преобразованного пространства, и наоборот.

Дэвис [329] применил эти данные к нативным глобулярным белкам и обнаружил явную антикорреляцию между содержанием спиралей, найденным измерениями дисперсии оптического вращения (ДОВ) [330] и содержанием аминокислотных остатков (Ser + Val + + Cys + Thr + Ile). Как видно из табл. 6.1, первые три из них, по Блоуту и сотр. [328], являются спираленарушающими остатками. Остатки Thr и Ile были выбраны в связи с их сходством соответственно с Ser и Val.

Таблица 6.1 Тенденция встраиваться в а-спиральа


Блоут и сотр., 1960 [328]

Котельчук и Шерага. 1968 [363]

Льюис и сотр., 1970 [368]

Робсон и Пэйн, 1971 [346]

Чоу и Фасман, 1974 [340]

Финкельштейн и Птицын,

1976 [371]

А

Ala

(Н)

Н

І

+0,09

1,45

1.08

С

Cys

С

Н

І

+0,03

0,77

0,95

D

Asp

Н

С

В

—0,02

0,98

0,85

E

Glu

Н

Н

Н

+0,12

1,53

1,15

F

Phe

(Н)

Н

Н

+0,03

1,12

1,10

G

Gly

В

—0,05

0,53

0,55

H

His

(Н)

Н

І

+0,08

1,24

1,00

I

Ile

(С)

Н

Н

+0,07

1,00

1,05

K

Lys

(Н)

С

І

—0,03

1,07

1,15

L

Leu

Н

Н

Н

+0,11

1,34

1,25

M

Met

Н

Н

Н

+0,10

1,20

1,15

N

Asn

(С)

С

I

—0,4

0,73

0,85

P

Pro


В

0,59

Q

Gln

(Н)

Н

І

+0,07

1,17

0,95

R

Arg

(Н)

Н

І

+0,02

0,79

1,05

S

Ser

С

С

В

—0,07

0,79

0,75

T

Thr

(С)

Н

І

—0,01

0,82

0,75

V

Val

С

Н

I

0,04

1,14

0,95

W

Trp

(Н)

С

Н

+0,10

1,14

1,10

Y

Tyr

(Н)

С

Н

—0,02

0.61

1,10

а Эти свойства найдены по наблюдаемым частотам встречаемости. Аминокислотные остатки даны в алфавитном порядке в соответствии с однобуквенными символами. Символы «Н», «I» и «В» использованы для обозначения соответственно спиралеобразующих, индифферентных и нарушающих спираль. Буквой «С» обозначен беспорядочный клубок.

Корреляционный анализ расширяется по мере получения новых экспериментальных данных. Первоначальный успех Дэвиса стимулировал дальнейшие исследования корреляций в глобулярных белках. Однако перспективы таких работ оставались ограниченными до тех пор, пока оставалась малой экспериментальная основа, т. е. число известных трехмерных белковых структур. Поэтому ранние результаты Гуццо [331], Протеро [332], Хавенстина [333], Кука [334], Перити и сотр. [335], Данила [336] и Лоу и сотр. [337] представляют в основном исторический интерес. По мере расширения экспериментальной базы точность корреляции существенно улучшается.

Предлагаемые корреляционные методы, или, как их обычно называют, «методы предсказания вторичной структуры по аминокислотной последовательности» (сокращенно «методы предсказания»), можно разбить на две категории: вероятностные и физико-химические. К первой категории относятся методы, устанавливающие закономерности исключительно на основе статистического анализа исходных рентгеноструктурных данных. Физико-химические методы используют дополнительно (или исключительно) иную структурную информацию. Очевидно, что различие между этими двумя категориями не может быть очень четким и возможны промежуточные случаи, отнесение которых к первой или второй категории произвольно.

В этой главе будут обсуждены все применяющиеся в настоящее время методы, поскольку ни один из современных подходов, по- видимому, не имеет перед другими явных преимуществ. С другой стороны, даже методы, которые представляются сейчас совершенно неудовлетворительными, могут содержать идеи, полезные для дальнейшего усовершенствования подхода в целом.