Г.А. Скарук, Л.К. Бобров
ГПНТБ СО РАН, г.
Новосибирск
ГПНТБ СО РАН формирует следующие электронные каталоги:
каталог книг и сборников;
каталог авторефератов диссертаций;
каталог литературы временного хранения;
каталог отечественных периодических изданий;
каталог иностранной периодики.
Электронный каталог книг ведется с 1992 г. и включает описания около
105 тыс. документов. Он используется как для адресных, так и для
тематических поисков информации.
Прямой поиск возможен полям: ISBN и ISSN, автору, виду документа, году
и месту издания, шифрам хранения и языку основного текста документа, сиглам
библиотек; словам из заглавия, предметных рубрик и ключевым словам, индексам
ББК и ГРНТИ. Остальные поля доступны для последовательного поиска.
В докладе описываются результаты эксперимента, направленного на анализ
тематического поиска с использованием различных лингвистических средств, и
включающего oценку?
качества индексирования документов в ЭК средствами отдельных ИПЯ, в том
числе степень дублирования информации в различных поисковых полях;
уникальных поисковых возможностей и ограничений каждого ИПЯ;
трудоемкости индексирования запросов на каждом языке. Эксперимент
состоял в проведении серии поисков по реальным тематическим запросам с
определением формальной релевантности выданных системой документов. В
результате эксперимента была получена информация о:
относительной полноте выдачи информации при поиске на различных ИПЯ для
различных типов запросов (широко и узкотематических, отраслевых и
межотраслевых);
точности поиска на каждом языке; количественном распределении основных
причин потерь информации и информационного шума в каждом случае;
количестве уникальных документов, полученных при поиске на каждом ИПЯ;
степени совпадения лексики реальных информационных запросов и вербальных
ИПЯ. Кроме того была исследована степень дублирования в ПОД информации на
языках:
предметных рубрик и ключевых слов;
предметных рубрик и слов из заглавия документа;
предметных рубрик и ББК;
ББК и рубрик ГРНТИ.
На основе экспериментальных данных представляется возможным выработать
рекомендации по совершенствованию методики индексирования документов на
различных ИПЯ и оптимизации поисковых стратегий для различных типов
запросов.