Структура и функционирование белков. Применение методов биоинформатики - Джон Ригден 2014

Методы биоинформатики для изучения структуры и функций неупорядоченных белков
Свойства последовательностей БПН
Низкая сложность последовательностей и неупорядоченность

Еще одним проявлением периодической природы БПН является низкая сложность последовательностей (low sequence complexity) их полипептидных цепей. Применение функции энтропии (Shannon 1948) к аминокислотным последовательностям белков (Wootton 1994а, b) показало, что глобулярные белки пребывают преимущественно в состоянии с высокой энтропией (сложностью), тогда как во многих других белках наблюдаются обширные области с низкой сложностью. До 25% всех аминокислот в базе данных SwissProt находятся в областях с низкой сложностью, а 34% всех белков имеют по меньшей мере один такой сегмент (Wootton 1994а, b). Характер связи между низким уровнем сложности и неупорядоченностью рассматривается в двух исследованиях. Прежде всего, связь размера алфавита (количества аминокислот) и сложность с емкостью способа укладки изучали Ромеро и соавт. (Romero et al. 1999). Было установлено, что белки базы данных SwissProt охватывают весь возможный диапазон размеров алфавита (1-20) и диапазон энтропии (К=0,0-4,5), в то время как глобулярные домены занимают лишь ограниченные области (алфавит=10-20, К=3,0-4,2). Области с более низкими значениями (вплоть до размера алфавита=3 и К=1,5) соответствуют структурированным фибриллярным белкам, таким как скрученные спирали, коллагены и фиброины. Из полученных результатов следует, что минимальный размер алфавита, равный 10, и значение энтропии, составляющее около 2,9, являются необходимыми и достаточными условиями для определения последовательности, которая может сворачиваться в глобулярную структуру. При экстраполяции этих исследований на БПН (Romero et al. 2001) было показано, что распределение сложности в неупорядоченных белках смещается в сторону меньших значений, но в значительной степени перекрывается с таковым для упорядоченных белков. В целом, неупорядоченность участков коррелирует с низкой сложностью; как неупорядоченные области, так и области с низкой сложностью широко представлены в протеомах; однако низкую сложность и неупорядоченность не следует рассматривать как синонимы.