О кодировке ISO-8859-5

1. Введение

Стандарт ISO 8859-5 [1] определяет однобайтную восмибитную кодировку символов кириллицы и латинского алфавита ISO/IEC 8859-5:1988 (Information Processing -- 8-bit single-byte coded graphic character sets -- Part 5: Latin/Cyrillic alphabet).

Стандарт ISO 8859-5 является международным и поэтому в нем представлены не только символы алфавита русского языка, но и других языков, использующих кириллицу:

Это обстоятельство является особенно важным при разработке систем предачи, обработки и хранения информации. Именно поэтому кодировка ISO 8859-5 получила широкое распространение в программных продуктах, устройствах ввода и отображения информации крупных производителей программного обеспечения и вычислительной техники. Кроме этого, кодировка ISO 8859-5 широко используется в основных международных и индустриальных стандартах средств обработки, и передачи информации.

В сети Internet, кодировка ISO 8859-5 определена в стандарте STD-2 [2]:

    Name:   ISO_8859-5:1988
    Source: ECMA registry
    Alias:  iso-ir-144
    Alias:  ISO_8859-5
    Alias:  ISO-8859-5
    Alias:  cyrillic

Замечание: в настоящий момент в сети Internet для этой кодовой таблицы используются и другие синонимы (alias).

2. Коды символов

Русские буквы в кодировке ISO 8859-5 расположены в алфавитном порядке. Коды с 176 по 207 - заглавные буквы, коды с 208 по 239 - строчные буквы. Остальные cимволы кириллицы, включая русскую букву "Ё", располагаются на местах 161 - 175 (заглавные буквы) и 241 - 255 (строчные буквы). Коды символов кириллицы имеют смещение 864 (0x0360) отосительно универсальной шестнадцатибитной кодировки ISO 10646 [3].

Управляющие, латинские и специальные символы с кодами от 0 до 160 эквивалентны соответствующим символам в кодировке ISO 8859-1 (Latin Alphabet No. 1).

Буквы русского алфавита и их коды в стандарте ISO 8859-5 приведены в таблицах 1, и 2. В таблицах также приведены дескриптивные имена и коды символов согласно стандарту ISO 10646, а также имена символов [4], используемые в приложениях языка SGML [5], например, широкоизвестного языка гипертекстовой разметки HTML (HyperText Markup Language).

Список литературы

[1]
ISO/IEC 8859-5:1988 Information Processing -- 8-bit single-byte coded graphic character sets -- Part 5: Latin/Cyrillic alphabet.
URL - http://www.iso.ch/cate/d16342.html

[2]
STD-2 Assigned Numbers. J. Reynolds, J. Postel. October 1994. (RFC1700)
URL - http://info.internet.isi.edu/in-notes/std/files/std2.txt

[3]
ISO/IEC 10646-1:1993 Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane.
URL - http://www.iso.ch/cate/d18741.html

[4]
ISO 8879:1986 ENTITIES -- Russian Cyrillic
URL - ISOcyr1.ent.txt

[5]
ISO 8879:1986 Information processing -- Text and office systems -- Standard Generalized Markup Language (SGML).
URL - http://www.iso.ch/cate/d16387.html

[Русские кодировки]
ИВТ Федотов А.М. Введение в Internet
Документация по Интернет технологиям

Начало создания курса: Mondy, 19-Aug-1996 10:12:15 NOVST
Дата последней модификации: Thursday, 12-Feb-1998 00:00:00 NOVT
© 1996 - 2001, А.М.Федотов
© 1996 - 2001, Институт вычислительных технологий СО РАН, Новосибирск