Распознавание рода коронавируса на основе прототипных штаммов
Чалей М.Б.1, Кутыркин В.А.2
1Институт математических проблем биологии – филиал ИПМ им. М.В. Келдыша РАН, Пущино, Московская область, Россия
2Московский государственный технический университет им. Н.Э. Баумана, Москва, Россия
Аннотация. Предложен вариантный подход к распознаванию рода коронавируса на основе распределения частот кодонов в ORF1ab и генах структурных белков (S, M и N). Метод основан на модифицированной статистике, ранее показавшей свою эффективность при распознавании видов флавивирусов. Вариантный подход использует для распознавания рода коронавирусов как различные комбинации нескольких генов коронавируса, так и отдельные гены. Род коронавируса окончательно определяется по результатам анализа всех рассматриваемых вариантов. Предлагаемый метод разработан с помощью обучающей выборки геномов прототипных штаммов коронавирусов родов Alphacoronavirus, Betacoronavirus, Deltacoronavirus и Gammacoronavirus. Использование вариантного подхода для распознавания рода коронавируса показало его высокую достоверность на уровне 95 %. Среди всех вариантов совместного анализа наибольшую надежность (98 %) показало использование распознавания рода коронавирусов на основе частот кодонов ORF1ab. Вариантный подход выявил явление мозаичности в геномах коронавирусов при распознавании рода, когда результаты распознавания рода по отдельным генам расходились с окончательным определением рода коронавируса. Такое явление, по-видимому, отражает гомологичные рекомбинации генов между коронавирусами различных видов и пластичность генома коронавирусов в эволюционных процессах.
Ключевые слова: геном коронавируса, ORF1ab, S-ген, M-ген, N-ген, статистический анализ, вариантный подход к распознаванию рода коронавируса.