Коростелев Ю.Д. Исследование корреляций между аминокислотными последовательностями транскрипционных регуляторов и нуклеотидными последовательностями их сайтов связывания с ДНК
Ранее нами был разработан метод поиска скоррелированных замен в последовательностях ДНК-связывающих белков и их сайтов связывания. При тестировании на семействе LACI-регуляторов были обнаружены статистически значимо скоррелированные пары позиций, хорошо соответствовавшие ДНК-белковым контактам в структуре комплекса PurR_Ecoli с его оператором purF (PDB: 1qpz) [1].
В настоящей работе исследована новая версия БД LACI (любезно предоставлена О.Лайковой), которая почти в два раза больше ранее изученной выборки. В программу введена процедура учета филогенетической близости регуляторов и операторов. Полученные скоррелированные пары были сопоставлены с белок-ДНКовыми контактами в трех известных структурах (1qpz, 1efa, 1rzr) и с экспериментальными данными по точечному мутагенезу LACI_Ecoli и его оператора [2]. Исследованы перепредставленные пары слов (белковое слово − это аминокислотные остатки (а.о.) в заданных позициях, нуклеотидное слово — нуклеотиды в заданных позициях).
Полученный список скоррелированных пар позиций включает практически все полярные контакты боковых групп а.о. с азотистыми основаниями, существующие хотя бы в одной из структур. Две позиции регуляторов, 16 и 20 (нумерация по PurR_Ecoli) являются абсолютными лидерами по скоррелированности. У этой пары а.о. лежат на одной стороне распознающей альфа-спирали. Полученные таблицы сопряженности частот а.о. в позициях 16, 20 и нуклеотидов в позициях 5, 7 (нумерация позиций от 1 до 20, между 10 и 11 находится центр симметрии оператора) согласуются с экспериментальными данными [2].
Детальный анализ полученных предпочтительных пар позволил выявить несколько ярких зависимостей: T16 уменьшает вероятность пары R20-G5, что, по-видимому, обусловлено стерическими взаимодействиями, а комбинация S16R20 предпочитает G5C6, что можно интерпретировать как возникновение «сложного» [3] контакта аргинина с 2-мя последовательными нуклеотидами. Существование таких зависимостей побудило нас исследовать корреляции между парами слов (белковое слово – а.о. в позициях 16,20, нуклеотидное – нуклеотиды в позициях 5,6,7). Было показано, что перепредставленные пары слов не объясняются ни индивидуальными корреляциями, ни филогенетическим следом, поскольку они встречаются на разных ветвях дерева регуляторов.
При исследовании семейства регуляторов NrtR в предположительном ДНК-связывающем домене были обнаружены две сильно скоррелированых с ДНК позиции, расположенные в одной спирали через один виток. Был отмечен случай скоррелированных замен в белке и операторе у двух очень близких регуляторов.
Таким образом, предложенный метод позволяет не только предсказывать специфические контакты с ДНК, но и исследовать более тонкие взаимодействия между факторами транскрипции и нуклеотидами, влияющие на белок-ДНКовое распознавание. Полученные результаты полезны для планирования генно-инженерных экспериментов.
Литература.
1) Y.D.Korostelev et al. (2007) Proc. MCCMB-2007, 158-159.
2) J. Sartorius, etal. (1989) EMBOJ. 8: 1265-1270.
3) M. Nicolas et al. (2001)
Nucleic Acids Res. 29: 2860-2874.