РАСПОЗНАВАНИЕ МИКРОРНК ARABIDOPSIS THALIANA НА ОСНОВЕ КОНТЕКСТНОГО АНАЛИЗА MPSS ПОСЛЕДОВАТЕЛЬНОСТЕЙ
Савинская С.А.
микроРНК – одноцепочечные некодирующие РНК длиной 20-24 нуклеотида, которые в составе сложного белкового комплекса RISC комплементарно или частично комплементарно связываются с мРНК эукариот и приводят либо к ее разрушению, либо к ингибированию процесса трансляции с нее на рибосоме. Все известные миРНК эукариотических организмов принимают участие в регуляции многих клеточных процессов. Так, например, 38 (из 184) микроРНК растения Arabidopsisthalianaконтролируют экспрессию генов 11 семейств транскрипционных факторов и 16 семейств генов молекулярных клеточных реакций, которые ответственны за процессы нормального развития листа, цветка, реакции на стресс и гормон ауксин. Существующие компьютерные методы распознавания микроРНК основаны на использовании априорной информации о биологической модели их биогенеза и функционирования: шпилечная структура микроРНК предшественника и локализация последовательности микроРНК в стеблевой части этой структуры, комплементарность микроРНК к району связывания в мРНК мишени и феномен консервативности последовательностей некоторых микроРНК внутри царств растений и животных
Разработанными методами контекстного анализа последовательностей ARGO, SiteGA и ACTIVITY (Лаборатория теоретической генетики ИЦиГ) было показано наличие нетривиальных контекстных сигналов в последовательностях микроРНК Ar. thaliana, которые достоверно коррелируют со степенью их экспрессии в различных тканях. Также дискриминантным методом было показано, что последовательности микроРНК и микроРНК* достоверно различаются по значениям функций распознавания каждого метода, а последовательности микроРНК, микроРНК* и неканонические формы микроРНК достоверно различаются по семи параметрам – значения трех функций и количество нуклеотидов A,T,G,C. Это позволяет определить микроРНК как независимый класс биологических объектов и применить указанные методы для распознавания микроРНК среди данных эксперимента MPSS (Massively Parallel Signature Sequencing).
Из общей выборки 33173 коротких 21 нт последовательностей объединенным методом ARGO&SiteGA&ACTIVITY было распознано 299 последовательности, для 75(25%) из которых были найдены потенциальные мишени методом выравнивания по BLAST. А в соответствии с правилами объединения известных микроРНК Ar. thalianaв семейства, были выделены 5 новых семейств потенциальных микроРНК и 12 одиночных микроРНК, имеющих в качестве потенциальных мишеней группы мРНК, кодирующие гомологичные белки. Кроме того, были обнаружены новые члены семейства эндогенных коротких РНК tasi-ARF/TAS3 (At5g57735/At3g17185).
Таким образом, показана возможность применения методов распознавания, основанных только на данных контекстного анализа, к предсказанию растительных микроРНК.