Русская версия English version   
Том 15   Выпуск 1   Год 2020
Подход к отбору значимых признаков при решении биомедицинских задач бинарной классификации данных с микрочипов

Бойко И.Ю., Анисимов Д.С., Смолякова Л.Л., Рязанов М.А.

Алтайский государственный университет, Барнаул, Россия

Аннотация. В ряде современных биомедицинских исследований, направленных на поиск методов ранней диагностики онкологических заболеваний, используются микрочипы, содержащие определенную биологическую информацию о пациентах. На основе этих данных происходит отнесение пациентов к одному из двух классов, соответствующих наличию и отсутствию у пациента некоторого диагноза. При решении данной задачи отбор значимых признаков является одним из этапов, оказывающих решающее влияние на качество классификации. В данной работе предлагается критерий отбора значимых признаков, основанный на использовании ledge-коэффициента корреляции, введенного ранее для оценки степени взаимосвязи числового и бинарного признаков. Для двух наборов данных с микрочипов приведены сравнительные примеры их бинарной классификации с использованием трех алгоритмов отбора признаков, трех методов уменьшения размерности, шести моделей классификации. Использование ledge-критерия отбора признаков позволило получить качество классификации, сравнимое с результатами использования распространенных методов отбора признаков, таких как: t-критерий, U-критерий. Для рассмотренного в работе набора данных с пептидных микрочипов ранее была выявлена эффективность применения метода проекции на латентные структуры. Использование этого метода в сочетании с отбором значимых признаков ledge-критерием позволило получить более высокий показатель качества классификации.

Ключевые слова: отбор признаков, ledge-коэффициент, бинарная классификация, микрочипы, ROC-кривая, метод проекции на латентные структуры.

Содержание Оригинальная статья
Мат. биол. и биоинф.
2020;15(1):4-19
doi: 10.17537/2020.15.4
опубликована на рус. яз.

Аннотация (рус.)
Аннотация (англ.)
Полный текст (рус., pdf)
Список литературы

 

  Copyright ИМПБ РАН © 2005-2024