Поиск мегасателлитных тандемных повторов в геномах эукариот по оценке осцилляций кривых GC-содержания
Тетуев Р.К., Назипова Н.Н., Панкратов А.Н., Дедус Ф.Ф.
Учреждение Российской академии наук Институт математических проблем биологии РАН
Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики
Аннотация. Разработан эффективный метод для решения задачи распознавания участков протяженных (длиной от 1000 н. п.) размытых тандемных сегментных дупликаций в геномах высших эукариот. Основу метода составляет многократное сканирование генома с использованием скользящего окна с длинами рамки, равными степеням двойки начиная с 256 н. п. Для каждого окна подсчитывается процент GC-содержания, а последовательные значения этой характеристики определяют GC-профиль. Создано программное обеспечение, которое выявляет участки устойчивых осцилляций GC-профиля и определяет характеристики обуславливающих эти осцилляции паттернов периодичности. Преимущества нового подхода, использующего комбинацию численно-аналитических методов, позволили выявить мегасателлитные участки в геноме мыши.
Ключевые слова: размытые тандемные повторы, тандемные сегментные дупликации, геномы эукариот, осцилляции GC-профиля, мегасателлиты в геноме мыши.