Л.К. Бобров
ГПНТБ СО РАН, г. Новосибирск
В чем заключается проблема?
Занимая важное место в системе информационно-библиотечного обеспечения
НИР, существующие электронные каталоги обладают рядом существенных
недостатков, в том числе:
невысокая глубина ретроспективного охвата ввиду большой трудоемкости
ввода информации, недостаточной технической оснащенности библиотек, нехватки
технических и финансовых ресурсов;
невысокая сравнительно с качественными библиографическими базами данных
глубина индексирования;
нераскрытость содержания периодических и продолжающихся изданий.
Поэтому, если позволяют условия, имеет смысл использовать электронные
каталоги в комплексе с набором ретроспективных библиографических БД
соответствующего тематического наполнения (например, БД ВИНИТИ РАН, ИНИОН
РАН, и др., а также различные зарубежные БД, в т.ч. Current Contents).
Но даже такое решение чаще всего не дает пользователю ответа на все
интересующие его вопросы, и, в частности, ответа на вопрос о том, какую
фактографическую информацию содержит та или иная публикация и в какой форме
представлена эта фактографическая информация.
Данные обстоятельства особенно негативно сказываются на работе
проблемно-ориентированных информационно-библиотечных центров в области
естественных наук. Дело в том, что фонды первоисточников в данных центрах
относительно невелики, но весьма насыщены информацией фактографического
характера (в особенности если данный центр специализирован в определенной
области химии, биологии, физики).
Как можно решить данную проблему?
Возможно несколько вариантов решения данной комплексной проблемы.
1. Изменение системы индексирования документов в создаваемых каталогах
и библиографических базах данных. В этом случае необходимо создание
специальных информационно-поисковых языков и систем индексирования.
Вероятно, в ряде случаев будет необходимо введение нормированной лексики,
описывающей фактографическое содержание документов. Индексирование должно
будет осуществляться либо только проблемными специалистами, либо при их
существенном и непосредственном участии.
2. Создание полного набора фактографических БД и их использование в
комплексе с библиографическими БД (см., например, систему CHEMBANK,
представляющую собой комплекс фактографических и библиографических баз
данных по токсическим свойствам химических веществ) и электронными
каталогами.
Эта серьезная и трудоемкая задача вряд ли на сегодняшний день может
быть успешно решена библиотечным персоналом даже с привлечением проблемных
специалистов.
3. По-видимому, весьма близким к идеалу был бы вариант, когда имеется
полный ретроспективный каталог библиотеки и соответствующая ему
полнотекстовая база (базы) данных, включающая все первоисточники и
обладающая развитыми средствами навигации и поиска.
Но тогда это будет уже не обычная современная библиотека, а библиотека
электронная со всеми вытекающими отсюда особенностями.
4. С различными вариациями набор перечисленных выше решений можно было
бы продолжить, но и без этого видно, что решение должно лежать в плоскости
реально существующих сегодня условий, в которых функционируют
научно-технические библиотеки академических научных учреждений и
проблемно-ориентированные информационно-библиотечные центры.
Решением, способным поднять такие библиотеки на качественно новый
уровень уже сегодня, является создание системы квазиполнотекстовых баз
данных в дополнение к полным электронным каталогам.
Реализация такого решения базируется на использовании современной
техники сканирования текстов и программного аппарата распознавания образов,
позволяющего представить текст в виде стандартного ASCII - файла.
Первая задача, которая может быть решена таким образом - это создание
полного ЭК путем сканирования существующего карточного каталога.
Решение данной задачи включает этап предварительной разметки и
сортировки (по уровню качества и виду библиографических описаний) карточек,
этап собственно сканирования, этап преобразования графических изображений в
текстовый формат, этап корректировки и дополнения записей, конвертирование
текстовых файлов и формирование электронного каталога в виде базы данных,
управляемой выбранной СУБД.
Вторая задача - создание квазиполнотекстовой базы данных, также
распадается на несколько этапов, предваряемых отбором требуемых
первоисточников.
Увеличение "библиографической информативности" ЭК может быть достигнуто
путем сканирования наиболее информативных составляющих в выбранных изданиях
(например, оглавления, резюме и выводы в монографических изданиях,
оглавления и рефераты (профильных для данного центра) статей, опубликованных
в периодических и продолжающихся изданиях, и т.п.).
В рассматриваемом случае увеличение "фактографической" информативности
ЭК достигается путем сканирования соответственным образом отобранных
диаграмм, таблиц, графиков, рисунков и пр., причем в этом случае задача
перевода информации в текстовую форму (например, путем оцифровки графиков)
не является обязательной.
Заключение. Решение перечисленных задач предполагает реализацию мульти-
базовой концепции и обеспечение возможности комплексного использования
собственно электронных каталогов и создаваемых квазиполнотекстовых баз
данных. Это требует дальнейшей углубленной проработки, как, впрочем, и ряд
других вопросов, например вопросов организационно-технологического порядка
применительно к условиям СО РАН.
Однако проведенные нами совместно с АО "Унискан" эксперименты показали
перспективность данного направления и его принципиальную реализуемость.
Пользуясь случаем, автор выражает благодарность начальнику отдела АО
"Унискан" С.М. Крыцыну за инициативную помощь в проведении экспериментов на
оборудовании данного акционерного общества.