КАРТИРОВАНИЕ ФУНКЦИОНАЛЬНЫХ САЙТОВ БЕЛКОВ НА ЭКЗОННОЙ СТРУКТУРЕ ГЕНА
Медведева И.В.
Проблема сопоставления данных секвенирования нуклеотидных и аминокислотных последовательностей стала занимать умы ученых с момента самого их появления. Была построена статистика совпадения границ экзонов и белковых доменов на аминокислотной последовательности, при том выявлено, что группа генов, у которых эти границы действительно совпадают, является одной из преобладающих. На основе этих данных большой интерес представляет и исследование распределения функциональных сайтов на экзонной структуре гена.
Для решения этой проблемы был составлен алгоритм, использующий информацию баз данных PDBSite, PDB, EMBL и реализован на языке Perl с помощью программ Translate и ClustalW. Составлена выборка из 120 сайтов.
Были введены коэффициенты разрывности сайта по первичной последовательности и разрывности сайта по экзонам. Выявлено, что разрывность сайта по экзонам встречается в 12,5% случаев, что опровергает предположение о том, что сайты являются кластеризованными по первичной последовательности. Это же доказывает и распределение коэффициента, непосредственно характеризующего эту величину: большая часть сайтов описывается минимальным значением этого коэффициента.
Были также построены теоретические распределения, основанные на предположении о случайном распределении количества функциональных аминокислот в экзоне, однако реальное распределение это предположение не подтвердило. Однако показано, что среди известных сайтов число аминокислот преобладает в группе от 1 до 3.
Для полученной выборки выполняется правило, согласо которому чем больше экзонов содержит последовательность, тем больше экзонов вовлечено в образование функционального сайта. По имеющимся данным можно говорить о том, для одного сайта в экзонах, содержащих функциональные аминокислоты, на 50 аминокислот содержится одна функциональная. На каждые следующие 7 аминокислот добавляется еще одна функциональная аминокислота.
На основе исследованной выборки создана база данных, доступная у автора. Кроме эволюционного значения данных исследований, существует и их практическая ценность для биоинженерных исследований в целях создания белков с новыми свойствами, так как каждый функциональный сайт отвечает за склонность белка к той или иной функции.