Диброва Д.В. Улучшение сборки микробных геномов с использованием данных об их оперонной структуре
Сейчас секвенирование микробных геномов становится все более широко используемым, а задачи, связанные с ним, востребованными. Одна из них – задача контроля за ошибками.
В настоящей работе содержательно решается следующая задача. Дана пара бактериальных генов. Требуется на основе анализа банковских бактериальных геномов предсказать, могут ли составляющие эту пары гены лежать на геноме на значительном расстоянии друг от друга, или же на геноме эти гены должны располагаться рядом. Также предсказание требуется дополнить характеристикой достоверности.
Алгоритм, решающий сформулированную задачу, планируется применять при секвенировании бактериальных геномов:
1) для поиска возможных ошибок секвенирования;
2) для получения дополнительной информации о взаимном расположении
контигов на геноме (другими словами, для формирования скаффолдов по
набору контигов).
В алгоритме используется сходный с поиском оперонов подход.
При тестировании разработанного алгоритма на банковских геномах уже удалось выявить несколько вероятных ошибок секвенирования.
Литература
[1] Prediction of operons in microbial genomes, M.D. Ermolaeva et al., 1216-1221 Nucleic Acids Research, 2001, Vol. 29, No.5