VII Международная конференция по электронным публикациям "EL-Pub2002"

23-27 сентября 2002 г., г. Новосибирск, Академгородок,
(номер государственной регистрации 0320300063)

Тезисы докладов


Электронные корпусы старых текстов для филологических исследований

Лаврентьев А.М.

Институт филологии СО РАН (Новосибирск)

До недавнего времени единственным широко доступным источником материала для исследователей средневековых текстов были критические издания. Однако, как бы ни было тщательно подготовлено критическое издание, в нем всегда теряется часть информации о рукописном оригинале и содержатся интерпретации и коррективы издателя. Информационные технологии позволяют в корне изменить эту ситуацию. Появляется возможность публиковать цифровые фотографии рукописей, снабженные расшифровкой текста, позволяющей проводить поиск и анализ слов и графических объектов рукописи. Создание таких расшифровок (транскрипций) требует решения ряда методологических и технических вопросов, а также принятия определенной конвенции для кодирования специфических элементов средневековой графики.

Одним из первых опытов гипертекстового издания целой рукописной традиции явился проект "Charrette" Принстонского университета. Это доступное через Интернет издание включает цветные фотографии 8-ми сохранившихся рукописей романа Кретьена де Труа "Рыцарь телеги", их дипломатические транскрипции в формате SGML, текст критического издания и целый ряд "инструментов" для поиска и анализа материала, в том числе базы данных по поэтическим фигурам и грамматике.

В настоящее время эти базы данных создаются на основе критического издания, однако в перспективе планируется включение в них материала дипломатических транскрипций. При этом необходима модернизация формата этих транскрипций с целью облегчения их автоматической обработки и представления в удобном для пользователя виде. Конкретно модернизация состоит в переводе транскрипций в формат XML, включении в них ряда дополнительных элементов и разработке ряда "стилевых листков" и скриптов для различных вариантов представления текстов.

Принципы организации электронных корпусов старых текстов, выработанные в рамках проекта "Charrette", могут использоваться при подготовке электронных изданий любых обладающих исторической ценностью рукописных текстов, в том числе древнерусских. Важнейшими принципами таких изданий являются:

1. Включение в издание высококачественных цветных фотографий оригинала.

2. Максимально полное и адекватное отражение оригинала в транскрипции.

3. Система специальных кодов для трудночитаемых и допускающих неоднозначную интерпретацию фрагментов оригинала.

4. Соответствие транскрипции общепринятым международным стандартам электронной записи текстов (TEI).

5. Совместимость транскрипции с современными программными средствами визуализации и обработки электронных документов.

Все эти положения будут проиллюстрированы конкретными примерами в тексте доклада.

В настоящее время в Институте филологии СО РАН идет подготовительная работа по проекту электронного издания ряда русских сибирских летописей и памятников фольклора народов Сибири.

Адреса в Интернете:

1. Проект "Charrette": http://www.princeton.edu/~lancelot

2. Спецификация TEI: http://www.tei-c.org

Дополнительные материалы: HTML
Примечание. Тезисы докладов публикуются в авторской редакции



|Электронная библиотека| |Математические публикации| |Информационные ресурсы|
Ваши комментарии
Обратная связь
[SBRAS]
[Головная страница]
[Конференции]
[СО РАН]

© 2002, Сибирское отделение Российской академии наук, Новосибирск
© 2002, Объединенный институт информатики СО РАН, Новосибирск