Русская версия English version   
Том 11   Выпуск 1   Год 2016
О количестве перекрытий слов в паттернах

Фурлетова Е.И., Ройтберг М.А.

Институт математических проблем биологии, Российская академия наук, Пущино, Московская область, Россия
НИУ Высшая школа экономики, Москва, Россия
Московский физико-технический институт, Долгопрудный, Московская область, Россия

Аннотация. Изучалась задача оценки количества перекрытий в паттерне – наборе слов в некотором алфавите A, имеющих одну и ту же длину m. Получены теоретические и экспериментальные оценки количества перекрытий для паттернов двух видов. Первый из них – это случайные паттерны, для которых верна равномерная вероятностная модель: все буквы в алфавите A и, соответственно, все слова длины m равновероятны. Доказано, что среднее количество перекрытий P для случайных паттернов, состоящих из n слов длины m, линейно зависит от размера паттерна n и не зависит от длины слов в паттерне. В проведенных компьютерных экспериментах отношение  P/n менялось в пределах от 0.33 до 1.06; теоретические оценки этого отношения для тех же паттернов не превосходят 1.67. Вторым видом паттернов, изученных в статье, являются паттерны, заданные матрицами позиционных весов из базы данных HOCOMOCO и пороговыми весами. Для этих паттернов отношение количества перекрытий к количеству слов в экспериментах менялось от 0.004 до 1, для более половины паттернов это отношение меньше 0.1. 
 
Ключевые слова: перекрытие, паттерн, вхождение паттерна в последовательность.
Содержание Оригинальная статья
Мат. биол. и биоинф.
2016;11(1):14-23
doi: 10.17537/2016.11.14
опубликована на рус. яз.

Аннотация (рус.)
Аннотация (англ.)
Полный текст (рус., pdf)
Список литературы
Доп. материалы

 

  Copyright ИМПБ РАН © 2005-2024