Координаторы: д-р биол. наук Колчанов Н. А., член-корр. РАН Гончаров С. С.
Исполнители: ИЦиГ, ИМ, ИВМиМГ, ИВТ, ИТФ, МТЦ, ИТПМ, НИБХ СО РАН
Разработана, расширена и продолжает пополняться Интернет-доступная база данных TRRD (Transcription Regulatory Regions Database), предназначенная для накопления экспериментальной информации по структурно-функциональной организации регуляторных областей эукариотических генов (http://www.bionet.nsc.ru/trrd/). TRRD содержит самую крупную в мире коллекцию аннотированных регуляторных единиц генов эукариот (около 2000), а также сайтов связывания транскрипционных факторов (6431).
Разработаны методы построения статистических, марковских или комбинаторных моделей и грамматик порождения геномной ДНК. Создан пакет для статистического анализа генетических текстов на основе сложностного разложения и комбинаторных моделей порождения текста. Разработан метод визуализации генетических символьных последовательностей на основе графов де Брёйна. На основе методов Data Mining и Knowledge Discovery разработана компьютерная система “Gene Discovery” для автоматической продукции знаний и выявления кодов, посредством которых в геномной ДНК записана информация о локализации и специфической активности регуляторных районов, контролирующих транскрипцию генов.
Изучены распределения энергии комплементарных взаимодействий между сайтами сплайсинга и малыми ядерными РНК. С использованием комплекса методов расчета низкоэнергетических вторичных структур РНК исследована вторичная структура 5¢ - и 3¢ -нетранслируемых районов мРНК. Исследовано влияние контекстных и структурных характеристик нетранслируемых и кодирующих районов мРНК на эффективность трансляции. Исследована дифференциация одноклеточных организмов по критичным для эффективности экспрессии генов стадиям элонгации, изучен вклад частот использования кодонов.
Исследована структурно-функциональная организация белков, особенности структурно-функциональной организации и эволюции ДНК-связывающих доменов транскрипционных факторов. Разработана компьютерная программа для оптимального совмещения пространственных структур белков. Разработана база данных пространственных структур функциональных сайтов белков PDBSite. База данных содержит информацию о функции сайтов, координаты атомов и структурные характеристики сайтов. В базе представлен широкий спектр функциональных типов сайтов, из которых можно выделить три основных типа: сайты связывания лигандов, сайты активных центров ферментов и сайты биохимической модификации. Разработана программа распознавания функциональных сайтов в пространственных структурах белков PDBSiteScan.
Распознавание основано на базе структурного выравнивания сайтов из PDBSite и анализируемого белка с учетом особенностей структурной организации функциональных сайтов. Анализ ошибок распознавания сайтов с известной локализацией в пространственной структуре белков показал высокую точность метода PDBSiteScan (рис. 1).
Рис. 1. Пример распознавания каталитического центра гидролазы с использованием PDBSiteScan. Fig. 1. An example of hydrolase's catalytic centre recognition by PDBSiteScan. |
Разработана методика распознавания наличия, длины и места локализации сайтов разрезания белков. Исследованы реакции фотовозбужденных красителей с аминокислотами и белками в средах с ограниченной подвижностью. Проведено исследование кинетики олигопептидов на атомном уровне разрешения. Разработан новый метод систематизации информации, получаемой при компьютерном моделировании методами молекулярной динамики и Монте-Карло.
В области создания баз данных по структурно-функциональной организации генных сетей продолжалось совершенствование формата описания генных сетей в базе GeneNet с учетом их иерархической организации и пространственной распределенности процессов по различным компартментам организма. Создана SRS-версия базы данных GeneNet (http://wwwmgs.bionet.nsc.ru/mgs/systems/genenet/SRS.html), позволяющая генерировать запросы к базе и проводить контекстный поиск компонентов генных сетей. Развивается теория гипотетических генных сетей, что открывает возможность для синтеза генных сетей с любым наперед заданным количеством стационарных и/или осциллирующих режимов, а также для реализации многих других, возможно более сложных, систем с режимами функционирования, наиболее отвечающими определенным практическим задачам (рис. 2).
Рис. 2. Гипотетическая генная сеть, суммирующая бинарные восьмиразрядные числа. Fig. 2. The hypothetical gene network summarizing two binary 8-bits numbers. |
Создана новая версия GeneExpress-2.1 интегрированной Интернет-доступной электронной библиотеки по пространственным структурам и функциям ДНК, РНК, белков и генных сетей (http://wwwmgs.bionet.nsc.ru/mgs/gnw/). Разработан и интегрирован в систему GeneExpress-2.1 ряд новых средств автоматической визуализации данных и знаний по структурно-функциональной организации ДНК, РНК, белков генных сетей. Принципиальной методической особенностью, впервые примененной при интеграции ресурсов в GeneExpress-2.1, является учет естественной иерархии уровней молекулярно-генетических систем организмов (уровень ДНК, уровень РНК, уровень белков и уровень генных сетей).
Список разработанных интернет-ресурсов содержит 29 ссылок. Полный список публикаций по проекту составляет 36 статей в рецензируемых журналах.
Список основных публикаций
Оглавление | Далее |