XV Международная школа-семинар "Информационные технологии
в задачах математического моделирования"

Система публикации биологических данных в Интернет "Биоразнообразие Сибири"

А. М. Федотов, А. Г. Хорев, Н. Б. Ермаков, А. А. Красников,
О. А. Гребенюк, А. А. Федотов

Институт вычислительных технологий СО РАН
Центральный сибирский ботанический сад СО РАН
Новосибирск,Россия

Задача представления биологической информации в электронном виде далека от окончательного решения. Эта информация имеет следующие отличительные черты.

  1. Данные - это большой объем текстовой и графической информации.
  2. Как правило, данные имеют географическую привязку.
  3. Со временем данные подлежат обновлению, причем каждое обновление документируется.
  4. Данные имеют строго документированную структуру, которая плохо приспособлена для образовательных и исследовательских целей, так как исторически обусловлена и изменяется со временем.
  5. Как правило, данные имеют авторство и охраняются авторским правом.
  6. В любой научной работе по систематике, экологии и др. приходится часто обращаться к данным.

Все это обуславливает, с одной стороны, актуальность решения этой задачи, особенно реализации доступа к данным через Интернет, а с другой стороны, большую сложность подобной задачи. Похожей задачей в России занимается коллектив в Санкт-Петербурге [1]. В рамках предлагаемого проекта решаются следующие основные задачи.

  1. Разработка структуры хранения разнородной биологической информации.
  2. Разработка диалогового интерфейса доступа к данным через общедоступные броузеры Internet Explorer и Netscape Navigator.
  3. Разработка системы, позволяющей авторам вносить изменения в свои данные с удаленных компьютеров. Разработка системы защиты данных от несанкционированного исправления и незарегистрированного полного копирования. Документирование работы каждого автора.
  4. Привлечение авторов со всей России к публикации своих экспериментальных данных в данной системе.
  5. Автоматизация процессов поиска и публикации информации. Процесс создания многих биологических публикаций должен быть автоматизирован. Речь идет не только об удобном средстве ввода описаний видов и получения необходимых выборок из баз данных. Например, составляя определительные таблицы с учетом географического района, в котором они будут использоваться, можно сократить трудоемкость проверки в несколько раз [2], [3].
  6. Представление информации о географической привязке биологических данных с использованием готовых геоинформационных систем.
Большая часть трудностей решается вместе со специальной исследовательской группой Центрального сибирского ботанического сада (ЦСБС) СО РАН под рук. Н.Б.Ермакова.

В настоящее время реализованы следующие части проекта:

  1. Система поиска в базе данных "Флора Новосибирской области" с ГИС-визуализацией информации (доступна через броузеры IE и NN версий 4.0 и выше).
  2. Программное обеспечение для построения оптимальных определительных таблиц (экспериментальный вариант).
  3. Заполнена даза данных по экосистемам Сибири. Заполняется база данных по гербарию ЦСБС СО РАН.
  4. Cтруктура базы данных для определительных таблиц. Начато ее наполнение материалом многотомного издания ЦСБС СО РАН "Флора Сибири".

Данная работа выполняется в рамках проекта "Электронный атлас Биоразнообразия Растительного и Животного мира Сибири", входящего в программу "Электроннная библиотека Сибирского отделения РАН".

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований: грант N 97-07-90372.

Литература

  1. В.А.Капустин , Е.Г.Лебедева, Н.Н.Лунева, И.Г.Чухина
    Виртуальный гербарий Всероссийского НИИ растениеводства им. Н.И.Вавилова
    http://www.runnet.ru/tm98/110.htm
  2. Б. Я. Рябко, А. Ю. Харитонов
    Метод построения определительных таблиц, обнаруживающих и исправляющих ошибки Известия СО АН СССР, сер. биол. наук, вып. 1, 1982
  3. R. E. Krichevsky, B. Ya. Ryabko
    Universal Retrieval Trees Discrete Applied Mathematics 12(1985) p. 293-302