Русская версия English version   
Том 14   Выпуск 1   Год 2019
Использование вероятностных нейронных сетей для предсказания локализации белков в клеточных компартментах

Назин Петр Сергеевич1,2, Готовцев Павел Михайлович1

1НИЦ "Курчатовский институт", Москва, Россия
2Московский физико-технический институт, Москва, Россия

Аннотация. В данной работе описано использование аппарата вероятностных нейронных сетей для решения проблем биоинформатики на примере задачи определения локализации белков по их первичной структуре. В качестве исходных данных использованы наборы характеристик аминокислотных последовательностей белков, полученные различными программными средствами, нацеленными на поиск специфических сигнальных последовательностей, а также данные о том, где в клетке локализуются эти белки в клетках двух микроорганизмов – бактерии E. coli и дрожжей S. cerevisiae. Источник данных – UCI Machine Learning Repository (http://archive.ics.uci.edu/ml/datasets). Показана возможность применения вероятностных нейронных сетей для решения данной задачи, так как получена точность классификации 57.5 % и 85.0 % для дрожжевых и бактериальных клеток соответственно. Полученные показатели точности классификации использованных данных превышают, те, которые по данным литературы были достигнуты при применении других методов распознавания. Отмечено, что высокая скорость обучения и возможность модификации делает вероятностные нейронные сети перспективным инструментом для анализа данных биоинформатики.

Ключевые слова: вероятностные нейронные сети, локализация белков, классификация данных, машинное обучение, базы данных.

Содержание Оригинальная статья
Мат. биол. и биоинф.
2019;14(1):220-232
doi: 10.17537/2019.14.220
опубликована на рус. яз.

Аннотация (рус.)
Аннотация (англ.)
Полный текст (рус., pdf)
Список литературы

 

  Copyright ИМПБ РАН © 2005-2024