Л.К. Бобров
ГПНТБ СО РАН, г. Новосибирск
В чем заключается проблема? Занимая важное место в системе информационно-библиотечного обеспечения НИР, существующие электронные каталоги обладают рядом существенных недостатков, в том числе: невысокая глубина ретроспективного охвата ввиду большой трудоемкости ввода информации, недостаточной технической оснащенности библиотек, нехватки технических и финансовых ресурсов; невысокая сравнительно с качественными библиографическими базами данных глубина индексирования; нераскрытость содержания периодических и продолжающихся изданий. Поэтому, если позволяют условия, имеет смысл использовать электронные каталоги в комплексе с набором ретроспективных библиографических БД соответствующего тематического наполнения (например, БД ВИНИТИ РАН, ИНИОН РАН, и др., а также различные зарубежные БД, в т.ч. Current Contents). Но даже такое решение чаще всего не дает пользователю ответа на все интересующие его вопросы, и, в частности, ответа на вопрос о том, какую фактографическую информацию содержит та или иная публикация и в какой форме представлена эта фактографическая информация. Данные обстоятельства особенно негативно сказываются на работе проблемно-ориентированных информационно-библиотечных центров в области естественных наук. Дело в том, что фонды первоисточников в данных центрах относительно невелики, но весьма насыщены информацией фактографического характера (в особенности если данный центр специализирован в определенной области химии, биологии, физики). Как можно решить данную проблему? Возможно несколько вариантов решения данной комплексной проблемы. 1. Изменение системы индексирования документов в создаваемых каталогах и библиографических базах данных. В этом случае необходимо создание специальных информационно-поисковых языков и систем индексирования. Вероятно, в ряде случаев будет необходимо введение нормированной лексики, описывающей фактографическое содержание документов. Индексирование должно будет осуществляться либо только проблемными специалистами, либо при их существенном и непосредственном участии. 2. Создание полного набора фактографических БД и их использование в комплексе с библиографическими БД (см., например, систему CHEMBANK, представляющую собой комплекс фактографических и библиографических баз данных по токсическим свойствам химических веществ) и электронными каталогами. Эта серьезная и трудоемкая задача вряд ли на сегодняшний день может быть успешно решена библиотечным персоналом даже с привлечением проблемных специалистов. 3. По-видимому, весьма близким к идеалу был бы вариант, когда имеется полный ретроспективный каталог библиотеки и соответствующая ему полнотекстовая база (базы) данных, включающая все первоисточники и обладающая развитыми средствами навигации и поиска. Но тогда это будет уже не обычная современная библиотека, а библиотека электронная со всеми вытекающими отсюда особенностями. 4. С различными вариациями набор перечисленных выше решений можно было бы продолжить, но и без этого видно, что решение должно лежать в плоскости реально существующих сегодня условий, в которых функционируют научно-технические библиотеки академических научных учреждений и проблемно-ориентированные информационно-библиотечные центры. Решением, способным поднять такие библиотеки на качественно новый уровень уже сегодня, является создание системы квазиполнотекстовых баз данных в дополнение к полным электронным каталогам. Реализация такого решения базируется на использовании современной техники сканирования текстов и программного аппарата распознавания образов, позволяющего представить текст в виде стандартного ASCII - файла. Первая задача, которая может быть решена таким образом - это создание полного ЭК путем сканирования существующего карточного каталога. Решение данной задачи включает этап предварительной разметки и сортировки (по уровню качества и виду библиографических описаний) карточек, этап собственно сканирования, этап преобразования графических изображений в текстовый формат, этап корректировки и дополнения записей, конвертирование текстовых файлов и формирование электронного каталога в виде базы данных, управляемой выбранной СУБД. Вторая задача - создание квазиполнотекстовой базы данных, также распадается на несколько этапов, предваряемых отбором требуемых первоисточников. Увеличение "библиографической информативности" ЭК может быть достигнуто путем сканирования наиболее информативных составляющих в выбранных изданиях (например, оглавления, резюме и выводы в монографических изданиях, оглавления и рефераты (профильных для данного центра) статей, опубликованных в периодических и продолжающихся изданиях, и т.п.). В рассматриваемом случае увеличение "фактографической" информативности ЭК достигается путем сканирования соответственным образом отобранных диаграмм, таблиц, графиков, рисунков и пр., причем в этом случае задача перевода информации в текстовую форму (например, путем оцифровки графиков) не является обязательной. Заключение. Решение перечисленных задач предполагает реализацию мульти- базовой концепции и обеспечение возможности комплексного использования собственно электронных каталогов и создаваемых квазиполнотекстовых баз данных. Это требует дальнейшей углубленной проработки, как, впрочем, и ряд других вопросов, например вопросов организационно-технологического порядка применительно к условиям СО РАН. Однако проведенные нами совместно с АО "Унискан" эксперименты показали перспективность данного направления и его принципиальную реализуемость. Пользуясь случаем, автор выражает благодарность начальнику отдела АО "Унискан" С.М. Крыцыну за инициативную помощь в проведении экспериментов на оборудовании данного акционерного общества.