Русская версия English version   
Том 15   Выпуск 2   Год 2020
Технология структурирования и обработки транскриптомных данных на основе гибридного использования RDBMS и NoSQL подходов

Мухин А.М.1,2, Генаев М.А.1,2,3, Рассказов Д.А.1,2, Лашин С.А.1,2,3, Афонников Д.А.1,2,3

1Федеральный исследовательский центр Институт цитологии и генетики СО РАН, г. Новосибирск, Россия
2Курчатовский геномный центр, Институт цитологии и генетики Сибирского отделения Российской академии наук, г. Новосибирск, Россия
3Новосибирский государственный университет, г. Новосибирск, Россия

Аннотация. Эксперимент по секвенированию транскриптома (RNA-seq) стал практически рутинной процедурой для изучения как модельных организмов, так и для сельскохозяйственных культур. В результате биоинформатической обработки таких экспериментов получаются объемные разнородные данные, представленные нуклеотидными последовательностями транскриптов, аминокислотными последовательностями и их структурно-функциональной аннотацией. Полученные данные важно представить широкому кругу исследователей в виде баз данных (БД). В работе предложен гибридный подход к созданию молекулярно-генетических баз данных, которые содержат информацию о последовательностях транскриптов и их структурно-функциональной аннотации. Сущность подхода в одновременном хранении в БД информации как структурированного типа, так и слабо структурированных данных. Технология использована для реализации БД транскриптомов сельскохозяйственных растений. В работе рассматриваются особенности реализации такого подхода и примеры формирования как простых, так и сложных запросов к такой базе данных на языке SQL. База данных OORT реализована для пяти сельскохозяйственных растений, она находится в свободном доступе по адресу: https://oort.cytogen.ru/.


Ключевые слова: база данных, индексация, запросы, растения, SQL, RDBMS, NoSQL, транскриптомы, сельскохозяйственные культуры.

 
Содержание Оригинальная статья
Мат. биол. и биоинф.
2020;15(2):455-470
doi: 10.17537/2020.15.455
опубликована на рус. яз.

Аннотация (рус.)
Аннотация (англ.)
Полный текст (рус., pdf)
Список литературы

 

  Copyright ИМПБ РАН © 2005-2022