О.В. Кириллова, Н.А. Мазов
ОИГГМ СО РАН, г. Новосибирск

ОПЫТ РАЗРАБОТКИ И ГЕНЕРАЦИИ АНГЛОЯЗЫЧНОЙ БАЗЫ ДАННЫХ ПО ГЕОЛОГИИ И ОКРУЖАЮЩЕЙ СРЕДЕ СИБИРИ И ДАЛЬНЕГО ВОСТОКА
THE EXPERIENCE OF ELABORATION AND GENERATION OF "SIBERIAN AND FAR EAST GEOLOGY AND ENVIRONMENT" DATABASE IN ENGLISH

                            Abstract

     The increasing interest of foreign scientists  to  the  geological  and
ecological  subjects  of Russian research investigations is underlined.  The
experience  of  generation  of  database  on   these   subjects,   including
description,  mainly,  of Russian publications with abstracts in English, is
described.  The  Database  is  being  prepared  on  diskettes  and  must  be
circulated  as a subscribed serial edition (4 issues per year) among foreign
users.  The beginning of this work is the result of UNESCO  initiative,  who
offered the contract for this work.

     В последнее  время значительно возрос интерес зарубежных специалистов к
научным публикациям российских ученых  различных  тематических  направлений.
Особенно  этот  интерес  заметен в части публикаций в области наук о Земле и
экологии.  Кроме  научного  интереса,  зарубежные  специалисты  имеют  также
практическую   заинтересованность,   особенно  в  информации  о  минеральных
ресурсах России.
     База данных на английском языке по геологии и окружающей среде Сибири и
Дальнего  Востока  ("Siberian  and  Far  East  Geology  and  Environment"  -
SIBERGEN)  является  в России пионерским начинанием подготовки отечественных
реферативных баз данных,  рассчитанных на зарубежного пользователя.  Наличие
языкового барьера у иностранных специалистов затрудняет получение и изучение
информации о публикациях на русском языке.  И  хотя  все  больше  публикаций
российских ученых появляется в зарубежных периодических изданиях, процент их
весьма  незначителен.  Находящие  отражение  в   зарубежных   базах   данных
отечественные  издания,  как правило,  не имеют рефератов (пример,  "Доклады
Академии наук" в "Current Contents" и многие другие).  Поэтому очень  важной
задачей является подготовка рефератов на английском языке.
     Заинтересованность в такой информации была продемонстрирована наглядно,
когда  ЮНЕСКО  предложила  контракт  на  подготовку  базы  данных  указанной
тематики.  Контракт был подписан в сентябре 1995 г.,  и с октября  этого  же
года Институт приступил к подготовке первого выпуска.
     Отсутствие опыта подготовки подобных баз данных означает, прежде всего,
и  отсутствие  каких-либо  отечественных нормативно-методических разработок.
Поэтому построение всей системы подготовки  от  разработки  форматов  ввода,
организации  технологии  сбора  информации  и  наполнения  базы,  разработки
необходимых инструктивных  документов,  организации  рекламы  на  английском
языке,  до разработки необходимого программного обеспечения должного уровня,
является задачей исполнителей проекта.
     Ориентация на  зарубежного  пользователя  ставит,  естественно,  задачу
подготовки БД в соответствующем международным стандартам виде.  Поэтому  при
разработке  и  описании форматов ввода информации изучаются,  сравниваются и
берутся  за  основу  такие  коммуникативные  форматы,  как  "CCF  -   Common
Communication  Format" (UNESCO),  "UNIMARC",  МЕКОФ.  Кроме того,  изучаются
доступные исполнителям зарубежные БД ("GeoRef",  "Current Contents", "SCI" и
другие)  с  точки  зрения  принятой  в  них  структуры документов и форматов
вывода.
     Основным обменным  форматом является формат ISO 2709,  который принят в
ППП CDS/ISIS/M.  Указанный пакет взят за основу при разработке  программного
обеспечения  и  адаптирован  к  задачам проекта со значительными доработками
автора доклада.
     В процессе  подготовки  БД  возникало  и  возникает множество вопросов,
касающихся  технологической,  информационной,  лингвистической,  программной
частей, которые требуется решать оперативно в связи с существующими жесткими
сроками выпуска БД (БД должна выпускаться 4 раза в год и иметь объем каждого
выпуска  не менее 500 документов).  Однако первый выпуск БД был подготовлен,
сдан в срок и принят ЮНЕСКО.  В  настоящее  время  заканчивается  подготовка
второго выпуска. БД распространяется на дискетах. Однако в ближайшем будущем
стоит задача предоставления БД в INTERNET.