Протеомика - примеры моделей

Профили аминокислотных последовательностей, позиционно- зависимые матрицы замещения

Выравнивание аминокислотных последовательностей хорошо работает при достаточно высоких коэффициентах идентичности последовательностей (более 35—40%). Однако если учесть тот факт, что большинство белков, обладающих сходными пространственными структурами, имеют коэффициент идентичности порядка 7—10% (см. подпараграф 3.4.2), становится понятна востребованность подходов, позволяющих корректно выравнивать последовательности, имеющие коэффициент идентичности менее 35%.

Одним из способов повысить чувствительность выравниваний стало применение для выравнивания с исследуемой последовательностью не отдельных последовательностей из базы данных, а групп последовательностей, объединенных во множественные выравнивания, т.е. вместо выравнивания типа последовательность — последовательность использовать выравнивание типа последовательность — группа последовательностей (рис. 3.28). Позже этот подход трансформировался в использование профилей аминокислотных последовательностей.

Допустим, у нас имеется множественное выравнивание аминокислотных последовательностей. Каждая позиция этого выравнивания характеризуется определенным соотношением частот встречаемости аминокислот в соответствующем ей столбце выравнивания. Если мы поделим частоту встречаемости каждого остатка в данной позиции на его «среднюю» частоту встречаемости в белках, то получим набор коэффициентов, показывающий предпочтения нахождения конкретных типов остатков в данной позиции множественного выравнивания относительно случайного распределения остатков.

Пример выравнивания последовательности (нижняя строчка) против набора родственных последовательностей, составляющих множественное выравнивание

Рис. 3.28. Пример выравнивания последовательности (нижняя строчка) против набора родственных последовательностей, составляющих множественное выравнивание:

остатки множественного выравнивания, совпадающие с остатками в последовательности, выделены рамочками

Для удобства дальнейшей работы с данными коэффициентами, и как это принято для матриц замещения, используют логарифмы коэффициентов. Обработав подобным образом все позиции множественного выравнивания, мы получим то, что называется профилем аминокислотных последовательностей, или позиционно-зависимой матрицей замещения (position specific substitution matrix). Действительно, при обычном выравнивании последовательностей каждая позиция одной из выравниваемых последовательностей замещается на «столбец» значений, который берется из матрицы замещения. Соответственно, позиции, в которых находятся одинаковые остатки, будут иметь одинаковые столбцы.

В случае использования профилей аминокислотных последовательностей каждый столбец специфичен для каждой позиции, что и позволяет добиваться большей чувствительности при выравнивании типа последовательность — профиль относительно выравниваний типа последовательность — последовательность (рис. 3.29).

Дальнейшие улучшения изложенной выше схемы связаны с учетом неравномерности расположения пропусков во множественных выравниваниях, на основе которых составляется профиль, кластеризацией высокогомологичных последовательностей при составлении профиля, а также с созданием специализированных алгоритмов, ориентированных на выравнивание типа последовательность — профиль.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >