В.А. Глухов, О.Л. Лаврик
ИНИОН РАН, ГПНТБ СО РАН,
г. Новосибирск
Поиск в базах данных на CD-ROM или удаленный доступ к БД - сканирование/распознавание источника или использование готового электронного издания - передача электронной копии по каналам связи: такова основная технологическая формула, которая может позволить и позволяет библиотекам и специальным центрам осуществлять новую форму информационного сервиса - оперативную электронную доставку копий документов (ЭДД). Можно выделить 2 основные схемы ЭДД (или современной системы ИРИ и ответов на разовые запросы), выполняемой библиотеками: I. Распространение текущей и ретроспективной информации о содержании фонда на CD-ROM. Поиск в БД на CD-ROM. Заказ копии по электронной почте. Выполнение заказа (изготовление электронной полнотекстовой копии издания или его части сканированием либо использование имеющегося электронного издания). Отправка заказа по email. II. On-line поиск в удаленных БД (электронных каталогах/тематических БД с аналитической росписью документов). Заказ копии нажатием клавиши. Выполнение заказа. Отправка заказа. Возрастающий объем публикаций, растущая стоимость книг и журналов и удорожание доставки создают ситуацию, при которой ресурсов, имеющихся в любой библиотеке, становится недостаточно для удовлетворения информационных потребностей читателей. Даже страны с хорошо развитой экономикой могут, в некотором смысле, испытывать нехватку информации, особенно в удаленных регионах [1]. Новая форма информационного сервиса дает следующие основные преимущества: 1. При работе в сети: поиск и заказ статей в режиме диалога очень прост. Копия статьи или глава из книги может прийти факсом или по e-mail практически в течение суток; БД, доступная в диалоговом режиме, обновляется ежедневно, и это гарантирует, что статьи появятся в системе сразу же после публикации; в принципе, у пользователя может отпасть необходимость платить за подписку. Просмотр БД с аналитической росписью статей или БД с содержанием журналов в некоторых ныне действующих системах - бесплатный. Плата производится только за копию и доставку статьи, причем цена высвечивается на экране до момента отправки заказа. Обе системы (на CD-ROM и через сеть) позволяют пользователю/организации создать свою собственную ПОБД из записей или фрагментов содержания журналов, сделать списки необходимых журналов, и затем система (сетевая), по мере выхода этих журналов, будет автоматически посылать информацию/копии содержания этих журналов на электронный адрес пользователя [2]. 2. Работа по схеме с CD-ROM позволяет практически безгранично расширить число пользователей и также оперативно обеспечивать ЭДД. Затраты на создание этой системы гораздо ниже по сравнению с высокими капитальными затратами на создание и поддержание сети. В качестве примеров действующих систем и кооперации в работе можно привести следующие: Служба UnCover (США) - самая мощная в мире система ЭДД, работающая в диалоговом режиме. Она обеспечивает доставку любой статьи на английском языке "на стол" менее чем за 24 часа [2]. Британская библиотека (British Library) в рамках нового подхода к системе ИРИ распространяет новый продукт на CD-ROM "Социальные и гуманитарные науки". Содержит 700 тыс. статей, которые отбираются ежегодно из 7 тыс. журналов. Используя ПО, предоставляемое вместе с диском, пользователь может выбрать ссылки из БД, передать заказ в Центр доставки документов Британской библиотеки и получить документ в течение 2 часов [3]. Немецкий библиотечный институт (Deutsches Bibliotheksinstitut) обеспечивает диалоговый поиск в БД и заказ документов через систему DBI-LINK. Это самая активно используемая служба ЭДД в Германии. Поиск осуществляется в сводном региональном (национальном) каталоге и других БД. Сразу же после поиска можно заказать копию. Его выполняет либо одна из немецких библиотек-поставщиков, либо Служба ЭДД Британской библиотеки, либо Служба ЭДД при Библиотеке Королевской академии искусств и науки Нидерландов [4]. В России такую форму информационного обслуживания предлагает Институт научной информации по общественным наукам (ИНИОН) РАН. С 1994 г. он начал создавать БД, отражающие его фонд на CD-ROM. Институт распространяет CD-ROM с библиографией изданий по всем отраслям социальных и гуманитарных наук, поступивших в его фонды за 1993 - 1995 гг. (около 250 тыс. записей), библиографию по государству и праву (1986-1995 гг.; 110 тыс.); библиографию по литературоведению (1986-1995 гг.; 130 тыс.) Используется отечественное программное обеспечение IRBIS (MS-DOS 3.3 и выше), позволяющее пользователям при необходимости формулировать достаточно сложные запросы. Для тех, кто приобрел CD-ROM, ИНИОН выполняет работу по обеспечению электронными копиями источников, главным образом небольших статей из журналов и сборников [5]. On-line БД и CD-ROM обновляются одновременно. В начале 1996 г. проведен эксперимент по ЭДД для читателей библиотеки Саратовского госуниверситета и Карельской областной библиотеки. Прием заказов и отправка электронных копий небольшого объема (до 15 - 20 страниц) осуществлялась по электронной почте. Эксперимент показал, что подготовка путем сканирования и перевода в ASCII-коды электронных копий современных изданий по силам любой библиотеке. Определенные сложности возникают с изданиями, выполненными на плохом полиграфическом уровне или содержащими значимый иллюстративный материал - схемы, графики, фотографии и т.д. Подобные издания приходится передавать пользователям как image-файлы, что весьма невыгодно (требуются большие объемы машинной памяти, дорого обходится передача данных). Если же иллюстративный материал не передается пользователю, теряется то, что особенно ценно в публикациях по археологии, лингвистике, математике и т.п. (карты, схемы, фотографии, рисунки; в известной степени диакритические, математические и специальные знаки). Кроме того, передача этих фрагментов исходного текста вне основного материала, по отдельности, не самое хорошее решение - теряется оригинальность восприятия - правда, при этом не нарушаются права издателя. Несовершенство программ распознавания, невнимательность оператора, его незнание языка источника может привести к тому, что смысл исходного текста окажется недоступен пользователю или, что еще хуже - будет искажен (например, это очень важно, когда требуется ссылка на законодательные акты и вообще необходимо для достоверных ссылок на любую публикацию). Попутно заметим, что российские пакеты распознавания шрифтов, решающие неведомую Западу проблему кириллицы, к сожалению, пока не содержат функцию объединения в одном объекте текстовой информации и фрагментов изображений; не имеют удобных средств проверки лексики; дают большой процент ошибок при работе с многогарнитурными и многоязычными текстами, а также текстами с плохим полиграфическим исполнением. Существует идея организации мировой службы доставки документов [1]. Однако очевидно, что по мере развития сетей, одна подобная система не справится со все возрастающим объемом заказов. И здесь на первый план выходит межрегиональная, даже межнациональная кооперация. Приводятся такие цифры: ситуация с ЭДД нормальна тогда, когда 50% заявок на документ удовлетворяются в регионе, еще 40% - на национальном уровне, а последние 10% - в рамках международной системы [1]. И в этом смысле ясно, что проблема ЭДД через библиотеки, и прежде всего для нашей страны, сейчас принципиально не техническая и даже не технологическая, а организационная в самом широком смысле. Технологии или их основы для организации ЭДД есть во многих регионах. Покупка оборудования или связь с мировой сетью будет оставаться проблемой некоторое время, но постепенно будет решена. А организационные вопросы пока даже не ставятся. Кроме того, для того, чтобы и Россия могла включиться в мировую систему ЭДД, она, помимо копии источника, должна будет обеспечить пользователя его переводом хотя бы на английский язык. Здесь также обязательно возникает вопрос об унифицированной системе индексирования документов, что важно для их поиска вне гипертекстовых систем. Возвращаясь к внутрироссийской системе, полагаем, что cейчас в России возможны следующие схемы организации ЭДД: I. Региональный информационный центр/библиотека приобретает у центральных ИЦ/библиотек фрагменты документальных БД, отражающие его/ее фонд. Сливает приобретенную БД с данными собственного электронного каталога и готовит CD-ROM. Распространяет CD-ROM с текущей и кумулятивной информацией/организует сетевой доступ к БД. Обеспечивает доставку копий по электронной почте своим региональным пользователям. II. Центральные ИЦ/библиотеки создают БД на CD-ROM, имеющие, помимо всего, информацию о том, в каких региональных центрах есть первоисточник. Распространяют CD-ROM/ организуют сетевой доступ. Пользователь решает сам, откуда ему оперативнее и выгоднее получить электронную копию. Проблемы подготовки электронных копий изданий остаются пока исключительно в компетенции самих библиотек (по аналогии с микрофильмированием или ксерокопированием). Но есть, наверное, и альтернативное решение. Вообще говоpя, сканирование и pаспознавание - довольно тpудоемкий и сложный путь для получения электронных копий. Это лучшее, что пока можно придумать для оперативного обслуживания пользователей библиотек, особенно отдаленных, копиями СТАРЫХ источников. Что же касается источников современных, то здесь дело может обстоять иначе. В России, где все еще сильны традиции централизации, проблема может быть решена на государственном уровне. А именно, путем организации сбора, наряду с печатным, электронного обязательного экземпляра (ЭОЭ) каждого издания. Сбор ЭОЭ может осуществляться Российской книжной палатой или специально созданным для этого центром, который затем передает электронные копии библиотекам для организации обслуживания потребителей (формирование своих полнотекстовых баз данных, подготовка на их основе аналитических обзоров и прочее). При таком решении на первый план выходят проблемы методологии, унификации представления информации при массе различий в уровне полиграфии издающих организаций у нас в стране. Но это, возможно, решило бы и некоторые юридические проблемы [6]. Тем не менее, несмотря на всю сложность проблемы, сейчас очень важно, чтобы работу по организации ЭДД начали именно библиотеки. В противном случае по мере развития сетей спрос на такие службы очень сильно возрастет. Те, кому нужна опубликованная информация, увидят, что посредством ЭДД можно получить копию гораздо быстрее, чем они могли бы получить ее по почте, заказывая в книжном магазине или через обычную систему МБА. Пока пользователи ожидают, что библиотеки удовлетворят эту их потребность. Если же они опоздают с организацией подобных служб, пользователи найдут альтернативные службы, так как им будет не важно, от кого получена копия, может быть даже от издателя. Можно прогнозировать определенную конкуренцию подобных служб, поскольку этот сервис может дать прибыль. Помимо перечисленных, для ЭДД есть и другие проблемы, требующие решения: экономические основы службы (способ оплаты, контроль, получение прибыли от услуги и т.д.); законодательные (авторское право, право издателя и его интересы - как они будут соблюдаться при копировании (может резко сократиться подписка); вопросы интеллектуальной собственности и др.). Вектор развития этой системы видится через доставку копии по e-mail (имиджа) или факсом "на стол" к доставке документа в цифровой форме "в компьютер". То есть это путь создания АРМ пользователя, и что важнее, АРМ специалиста, занимающегося анализом и синтезом информации, потому что возможность получения любого документа (полного текста!) из любой точки страны (мира) приведет к очередному информационному взрыву. Отсюда возникнет необходимость очередного витка сжатия (синтеза) информации. Сетевые системы дадут возможность доступа к необходимой информации. Пользователю станут необходимы средства навигации по динамически формируемой информационной системе для извлечения необходимых ему сведений и создания новых документов (обзоры, справки, прогнозы и т.д.). Вот те задачи, которые должны решать программные средства: 1) принимать и сохранять изображения различных форматов; 2) поддерживать все стандартные платформы АРМ; 3) объединять изображения с текстом, причем это должно решаться еще на стадии сканирования - распознавания текста; 4) редактировать; 5) управлять собственной электронной библиотекой/БД; 6) выводить документы на различные сетевые устройства; 7) управлять печатающими устройствами [7]. И самое главное - должны решаться программные проблемы унифицированной кодировки для всех существующих знаков (диакриты, математические, литературные, специальные знаки и символы, восточные языки); решать проблемы единого формата комбинированных (текст и изображение) изданий. Считаем, что систему "переработки" информации следует развивать параллельно с ЭДД. Иначе пользователь, столкнувшись, чисто психологически, с огромным количеством документов у себя в компьютере и видя свою неспособность их освоить, просто перестанет активно пользоваться системой ЭДД. Выводы: ЭДД - одна из бурно развивающихся форм информационно-библиотечных услуг. В России эта форма только-только стала зарождаться (ИНИОН, ГПНТБ СО РАН: литература по медицине). Библиотекам России необходимо срочно взять на себя функции по ЭДД. В противном случае их будут выполнять альтернативные службы. Необходимо на государственном уровне организационно решить проблему ЭДД. Параллельно с ЭДД следует развивать систему "переработки" информации. ЛИТЕРАТУРА 1. Frederick J. Friend. Document Delivery": A World Solution to a World Problem? // IFLA J. 1993. Vol. 19, N 4. P. 374 - 384. 2. Managing Information. 1995. Vol. 2, N 5. P.3. 3. The British Library "Inside": Проспект. London, 1996. 4 p. 4. DBI-LINK. Connection between users and libraries: Brief description / Deutsches Bibliotheksinstitut. Germany, 1996. 42 p. 5. Библиография по социальным и гуманитарным наукам 1993 - 1995: Проспект издания CD-ROM / ИНИОН РАН. М., 1996. 6. Глухов В.А. Доступ читателей к фондам библиотек и новые технологии // Теория и практика общественно-научной информации / ИНИОН РАН. М., 1996. Вып. 12. В печати. 7. Quinn R.A. Networked document imaging software: Guidlines to providing widespread access to information // Electron. Libr. 1994. Vol. 12, N 4. P. 370 - 371.