Г.А. Скарук, Л.К. Бобров
ГПНТБ СО РАН, г.
Новосибирск
ГПНТБ СО РАН формирует следующие электронные каталоги: каталог книг и сборников; каталог авторефератов диссертаций; каталог литературы временного хранения; каталог отечественных периодических изданий; каталог иностранной периодики. Электронный каталог книг ведется с 1992 г. и включает описания около 105 тыс. документов. Он используется как для адресных, так и для тематических поисков информации. Прямой поиск возможен полям: ISBN и ISSN, автору, виду документа, году и месту издания, шифрам хранения и языку основного текста документа, сиглам библиотек; словам из заглавия, предметных рубрик и ключевым словам, индексам ББК и ГРНТИ. Остальные поля доступны для последовательного поиска. В докладе описываются результаты эксперимента, направленного на анализ тематического поиска с использованием различных лингвистических средств, и включающего oценку? качества индексирования документов в ЭК средствами отдельных ИПЯ, в том числе степень дублирования информации в различных поисковых полях; уникальных поисковых возможностей и ограничений каждого ИПЯ; трудоемкости индексирования запросов на каждом языке. Эксперимент состоял в проведении серии поисков по реальным тематическим запросам с определением формальной релевантности выданных системой документов. В результате эксперимента была получена информация о: относительной полноте выдачи информации при поиске на различных ИПЯ для различных типов запросов (широко и узкотематических, отраслевых и межотраслевых); точности поиска на каждом языке; количественном распределении основных причин потерь информации и информационного шума в каждом случае; количестве уникальных документов, полученных при поиске на каждом ИПЯ; степени совпадения лексики реальных информационных запросов и вербальных ИПЯ. Кроме того была исследована степень дублирования в ПОД информации на языках: предметных рубрик и ключевых слов; предметных рубрик и слов из заглавия документа; предметных рубрик и ББК; ББК и рубрик ГРНТИ. На основе экспериментальных данных представляется возможным выработать рекомендации по совершенствованию методики индексирования документов на различных ИПЯ и оптимизации поисковых стратегий для различных типов запросов.