VII Международная конференция по электронным публикациям "EL-Pub2002"

23-27 сентября 2002 г., г. Новосибирск, Академгородок,
(номер государственной регистрации 0320300063)

Тезисы докладов


Древовидные структуры для хранения и представления данных

Рыжов В.С.

ИСИ CO PAH (Новосибирск)

Введение

Данный доклад посвящен решению проблемы построения каталогов для архивов информации. В настоящее время большая часть каталогов строится традиционным способом, без применения современных технологий, что приводит к огромным затратам ресурсов и времени, повышает значение человеческого фактора, а это влечет, в свою очередь, большое количество ошибок, так как человеку свойственно ошибаться.

Набор данных об объекте архива (единице хранения) хранится в карточке, представляющей собой описание ряда параметров (характеристик) объекта. Заметим, в данной работе мы будем иметь дело с существенно не однородными объектами, то есть набор параметров у различных объектов может быть неодинаков. Перебор объектов в каталоге осуществляется по одному или нескольким параметрам. Цель данной работы - показать способ оптимального построения каталогов для описанных объектов.

Древовидная иерархия для разнородных объектов

Как известно, древовидные структуры позволяют осуществлять самый понятный и быстрый поиск информации в каталоге. Любая попытка создания архива информации влечет за собой создание древовидной структуры хранимых данных, представляющей эти данные в удобном для использования виде. Формирование древовидной иерархии из списка разнородной информации есть основная задача построения каталогов, она же является одной из сложнейших.

Множество древовидных структур для отображения данных В условиях необходимости хранения информации о разнородных данных оказывается полезным создание не одной, а нескольких древовидных структур, отображающих одни и те же данные. Каждая из этих структур упорядочена по своим, отличным от других параметрам. Такой подход дает возможность сделать поиск не только интуитивно более понятным, но также позволяет значительно ускорить процесс поиска, что на практике означает более удобный доступ к хранимой информации.

Задача типизации объектов Объектный подход в решении задачи каталогизации и правильное заполнение карточек информацией позволяет практически полностью автоматизировать процесс создания деревьев и выявления взаимосвязей между различными сущностями. Главное при создании карточек - точно специфицировать тип соответствующего поля, только в этом случае возможно автоматическое построение деревьев. Создание типов карточек - это первое, с чего начинается процесс построения деревьев, но это не означает, что нельзя добавлять новые типы объектов в уже существующую структуру. При добавлении нового типа карточек может появиться новый вариант построения дерева, пригодный для использования. После того, как найдены все возможные варианты деревьев, эти варианты предлагаются на рассмотрение оператору, который производит экспертную оценку, руководствуясь целесообразностью включения в список каждой структуры, и выбирает из предложенного списка деревья, представляющие интерес для пользователей каталога.

Протокол LDAP для создания и хранения древовидных структур Для создания и хранения древовидных структур принято использовать LDAP. Это устоявшийся и довольно распространенный стандарт, он позволяет хранить и обрабатывать древовидные структуры стандартным образом. Для этого стандарта уже написано множество программных продуктов, позволяющих легко создавать и использовать древовидные структуры. Использование LDAP в качестве протокола для представления каталогов дает возможность написания достаточно универсального модуля, позволяющего общаться с каталогами посредством WEB, что, в свою очередь, позволяет значительно расширить аудиторию пользователей архива.

Заключение

Использование предложенных технологий позволяет практически полностью автоматизировать процесс каталогизации архивов, при этом не требуется писать программное обеспечение для всего процесса каталогизации, поскольку LDAP - очень распространенный протокол, и для него уже написано множество программ, облегчающих работу. Применение объектного подхода позволяет проводить автоматический поиск возможных деревьев и облегчает программирование, позволяя распараллеливать процесс написания приложений, при этом автоматическое выявление взаимосвязей позволяет найти такие, которые можно пропустить, если создавать каталог обычными средствами.

Примечание. Тезисы докладов публикуются в авторской редакции



|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
Обратная связь
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск