Русская версия English version   
Том 15   Выпуск 2   Год 2020
Исследование структуры кодирования ORF1ab, S, M и N генов коронавирусов

Чалей М.Б.1, Тюлько Ж.С.2,3, Кутыркин В.А.4

1Институт математических проблем биологии – филиал Института прикладной математики им. М.В. Келдыша РАН, Пущино, Московская область, Россия
2Омский государственный медицинский университет Минздрава России, Омск, Россия
3ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора, Омск, Россия
4Московский государственный технический университет им. Н.Э. Баумана, Москва, Россия

Аннотация. В работе спектрально-статистический подход применен к сравнительному анализу геномов коронавирусов четырех родов Alphacoronavirus, Betacoronavirus (включая новый SARS-CoV-2 вирус), Gammacoronavirus и Deltacoronavirus, который выполнялся с точки зрения наличия 3-регулярности и скрытой триплетной профильной периодичности в кодирующих последовательностях четырех структурных генов: ORF1ab, кодирующего транскриптазу; S-гена гликопротеина, формирующего шипы; M-гена мембранного белка; N-гена нуклеопротеина. Общее число анализируемых геномов составило 3410. Соответственно, оно определяло и численность каждой выделенной группы генов. В результате, практически во всех CDS анализируемых генов ORF1ab, S и N была выявлена скрытая профильная триплетная периодичность и высокое значение индекса 3-регулярности, как показателя качества сохранности триплетной структуры кодирования. Для M-генов, напротив, была выявлена тенденция к размытию их структуры кодирования вплоть до однородности 60 % этих генов в анализируемых геномах альфакоронавирусов и 67 % в геномах гаммакоронавирусов. Тенденция размытия такой структуры, сопровождаемая снижением среднего значения индекса 3-регулярности в сравнении с остальными генами, при сохранении триплетной профильной периодичности, была отмечена и для M-генов SARS-CoV-2 вируса. Возможно, отмеченная тенденция отражает значение изменчивости M-генов при адаптации коронавируса к новым хозяевам рода. Анализ матриц 3-профильной периодичности для четырех, анализируемых в работе генов вируса SARS-CoV-2, выделенного в Европе, Азии и США, не выявил их значимого различия, что предполагает единый источник распространения этого вируса.


Ключевые слова: свойство 3-регулярности CDS, скрытая профильная триплетная периодичность, геном коронавируса, геном SARS-Cov-2 вируса, ORF1ab, S-ген, M-ген, N-ген. 

Содержание Оригинальная статья
Мат. биол. и биоинф.
2020;15(2):441-454
doi: 10.17537/2020.15.441
опубликована на рус. яз.

Аннотация (рус.)
Аннотация (англ.)
Полный текст (рус., pdf)
Список литературы

 

  Copyright ИМПБ РАН © 2005-2022