Соглашение | Публикация статей

Краткие сведения о кодировках кириллицы
Категория: Статьи

В настоящее время существует шесть основных кодировок кириллицы, то есть наборов символов, с помощью которых можно отобразить на web-странице знаки русского алфавита.

ПРИМЕЧАНИЕ
Кодировкой кириллицы называется общепринятый стандарт, включающий набор символов, который позволяет отображать в документах HTML знаки русского алфавита.

Исторически первой возникла кодировка KOI8 (код обмена информации восьмибитный), соответствующая стандарту ГОСТ 19 768-74. Она была разработана в середине семидесятых годов специалистами одного из советских НИИ и к середине восьмидесятых стала базовой кодировкой для только что появившихся тогда в нашей стране русифицированных, совместимых с UNIX операционных систем. Именно благодаря этому на сегодняшний день KOI8 является основным стандартом для серверов, работающих на базе платформы UNIX (например, для HTTP-сервера Apache), а также используется в качестве «формата по умолчанию» при пересылке сообщений электронной почты на русском языке.

Компания Microsoft, создавая программное обеспечение для работы в Интернете, как водится, пошла своим путем, предложив стандарт Microsoft code page 1251 (Windows 1251), получивший чрезвычайно широкое распространение благодаря популярности операционной системы Microsoft Windows и HTTP-сервера Internet Information Server, входящего в комплект поставки Windows NT/2000.

Стандарт Microsoft/IBM code page 866 (альтернативная кодировка DOS) является базовым в операционных системах MS-DOS и OS/2, и потому в настоящее время данная кодировка медленно, но верно утрачивает свои позиции, поскольку даже сам разработчик и производитель DOS, компания Microsoft, отказалась от дальнейшей поддержки этой линии операционных платформ. Тем не менее кодировка жива и по сей день, прежде всего, благодаря тому, что часть пользователей не намерена пока расставаться с браузерами, работающими в среде MS-DOS, а также по той причине, что данный стандарт принят по умолчанию в некоммерческой сети FidoNet.

Кодировка ISO-8859-5 была разработана Комитетом по международным стандартам (International Standards Organization, ISO) и применяется в основном в совместимых с UNIX операционных системах. Поскольку данный набор символов был создан западными специалистами, плохо знакомыми не только с самим русским языком, но и с уже имеющимся многообразием кодировок кириллицы, ISO не получила широкого распространения, однако все же достаточно часто встречается в Интернете и активно поддерживается рядом русскоязычных серверов.

Macintosh CP (MAC) предназначена для использования на компьютерах Apple Macintosh, оснащенных операционной системой MacOS.

Универсальный международный стандарт Unicode (UTF-8) был создан с благородной целью - объединить все существующие на сегодняшний день национальные кодировки в одну. Поскольку для отображения одного символа в Unicode отводится не один байт, как это принято во всех остальных стандартах, а два, данная кодировка включает в себя 65 536 знаков вместо 256. В это число входят не только буквы всех алфавитов мира, как существующих ныне или созданных искусственно, так и уже практически вымерших, но и множество специальных символов - математических, музыкальных, физических. Стандарт Unicode является стандартом по умолчанию в операционной системе Microsoft Windows XP.

Большинство современных серверных программ обладают встроенной функцией автоматического определения кодировки, используемой клиентским программным обеспечением, и перевода текста в необходимый стандарт «на лету». Однако бывают ситуации, когда возможность автоматического распознавания необходимого пользователю набора символов на сервере отключена или попросту отсутствует. В этом случае содержащийся на web-странице или в сообщении электронной почты текст становится нечитаемым и пользователю необходимо переключить текущую кодировку вручную.


Статьи по теме:

Автоматизации планирования печатного издания под Apple (Mac)
Автоматизация Делопроизводства
Атака На Infinity Gb V2 2
Крэкинг (вершина айсберга)
Описание программ SetFag.pas и Fag.asm
Области применения экспертных систем
Сетевой аудит в NetWare 4.x
Политика ограничений Microsoft Internet Explorer
Компания «Антивирусные Решения» Удостоена «Золотого» Диплома За Ежегодное Участие В Выставке «Infosecurity Russia»
Накопители информации в компьютере
Возможности INTERNET
Демонстрационная программа графических функций языка С++
Четырехбитное мышление
Использование компьютеров
Новые концентраторы и коммутаторы BayStack компании Bay Networks
Аналоговые и цифровые схемы
Устройства ввода
Модуль
ВСТАВКА ТАБЛИЦ
FED monitors
Модуль CRT
Классификация локальной компьютерной сети (ЛКС)
Следственный осмотр
Организация объектов сети
Изменение механизма входа в систему
Языки программирования системного уровня
Архитектура украинского сегмента сети Internet
Компании лидирующие на мировом рынке CompactPCI продукции
Клавиатура
Удаленный доступ (telnet)
Импорт файлов в проект
Сканеры
Международная сеть INTERNET
Подделка компьютерной информации
Конверт
Изменение оформления Рабочего стола
Общая структура СКС
Кибернетика – наука ХХ века
Crm, Создание Программного Обеспечения
Установка охранных систем - актуальность возросла!
Разработка Баз Данных, Взгляд Изнутри
Создание и использование сводных таблиц EXCEL
Профилактические методы уменьшения усталости при работе за компьютером
Развитие кибернетики
Папка Избранное
Java, как объектно-ориентированный язык
Очистка очереди печати документов
Рисование многоугольников
Кластеры
Бесплатный Софт, Быть Или Не Быть
Spyware боя; Используйте предохранение от брандмауэра
Электронные таблицы «EXCEL»
Потеря информации – можно ли ее избежать?
Повышаем Права Пользователя
Копирование цвета области рисунка