Бутвиловский А.В., Одинцов А.О. Способ вычисления ошибки дистанции МакАйнерни и его практическое применение для решения прикладных задач
Цель исследования: разработать и апробировать способ вычисления ошибки дистанции МакАйнерни.
Материалы и методы. Предлагаемый способ вычисления ошибки дистанции МакАйнерни (Djk=Djk/nSDSE)предусматривает первоначальное определение отклонения (SDDjk) следующим образом: SDDjk=(∑2)/nd, где =−MVdBB, B =(RSCUabsVji − ki)/ы)1 п, n – число пар сравниваемых признаков. Для апробации предлагаемого способа проанализированы взятые с сервера NCBI (www.ncbi.nlm.nih.gov) последовательности мРНК, кодирующие ряд митохондриальных белков (субъединицы 1— 6, 4L НАДН-дегидрогеназы (НАДН-ДГ), цитохром b, субъединицы 1-3 цитохром-с-оксидазы (ЦО), субъединица 6 АТФ-синтазы) человека и трихинеллы (Trichinella spiralis). В качестве контроля использованы мРНК, кодирующие аналогичные белки свободноживущего круглого червя цианорабдитис (Caenorhabditis elegans). Показатели RSCU рассчитаны при помощи программы MEGA 3 [1]. Сходство стратегий кодирования изучаемых белков в мРНК определено по дистанции МакАйнерни [2] с вычислением ошибки предлагаемым способом.
Результаты и обсуждение. Дистанции МакАйнерни для мРНК, кодирующих субъединицу 1 НАДН-ДГ человека и трихинеллы (человека и цианорабдитис) равны 0,010±0,0015 (0,018±0,0020), НАДН-ДГ 2 – 0,022±0,0016 (0,016±0,0016), НАДН-ДГ 3 – 0,013±0,0022 (0,017±0,0021), НАДН-ДГ 4 – 0,024±0,0017 (0,017±0,0018), НАДН-ДГ 4L – 0,023±0,0023 (0,020±0,0024), НАДН-ДГ 5 – 0,023±0,0013 (0,020±0,0021), НАДН-ДГ 6 – 0,021±0,0021 (0,015±0,0019), цитохром b – 0,009±0,0013 (0,018±0,0017), ЦО 1 – 0,008±0,0009 (0,016±0,0016), ЦО 2 – 0,010±0,0014 (0,017±0,0016), ЦО 3 – 0,010±0,0014 (0,017±0,0016), АТФ-синтазу 6 – 0,008±0,0013 (0,018±0,0019). Предложенный способ является эффективным, так как он позволил вычислить ошибку дистанции во всех опытах. Отличия дистанций МакАйнерни недостоверны лишь для 3-х изученных мРНК, кодирующих (25,0±13,06%) белки человека и трихинеллы (по сравнению с таковыми для мРНК человека и цианорабдитис) – субъединицы 3, 4L и 5 НАДН-дегидрогеназы. Для остальных изученных мРНК различия являются достоверными (р<0,05), что свидетельствует о большем сходстве картины использования синонимичных кодонов в мРНК человека с таковой трихинеллы, а не цианорабдитис. Эти данные подтверждают возможность использования разработанного способа для решения прикладных задач.
Заключение. Предложенный способ вычисления ошибки дистанции МакАйнерни является эффективным. С помощью предлагаемого способа удалось установить, что картина использования синонимичных кодонов в мРНК человека более сходна с таковой трихинеллы (по сравнению с контролем).
Литература
1. Kumar, S. [et al.] (2004) MEGA3: Integrated software for molecular evolutionary
genetics analysis and sequence alignment // Brief. Bionform., № 5, p. 150-163.
2. McInerney, J.O. (1998) GCUA: General codon usage analysis // Bioinformatics,
№ 14(4), p. 372-373.