Выбор таргета в геномах прототипных штаммов для распознавания подрода коронавирусов
Чалей М.Б.1, Кутыркин В.А.2
1Институт математических проблем биологии – филиал ИПМ им. М.В. Келдыша РАН, Пущино, Московская область, Россия
2Московский государственный технический университет им. Н.Э. Баумана, Москва, Россия
Аннотация. В работе предложен таргетный подход к распознаванию подрода коронавируса на основе распределения частот кодонов N-гена белка нуклеокапсида. В предложенном подходе на основе статистики вычисляется отклонение распределения частот кодонов в N-гене анализируемого генома коронавируса от такого же распределения в каждом из 67 прототипных штаммов, характеризующих 23 подрода в четырех родах коронавирусов. Наименьшее отклонение от распределения в одном из прототипных штаммов указывает на подрод, к которому принадлежит этот штамм. Такой подход оказался эффективным и обеспечивает достоверность распознавания подрода коронавируса не менее 99 %. Среди всех кодонов генетического кода в соответствии с распределением их частот в N-гене коронавирусов выделены совокупности из 38 и 7 кодонов, обеспечивающих требуемую эффективность распознавания. Выделенные в этих совокупностях кодоны фиксируют таксономическую структуру подрода коронавируса.
Ключевые слова: подрод коронавируса, таргетный подход, прототипные штаммы коронавирусов, N-ген коронавируса, распределение частот кодонов в N-гене.