Главная | Партнер - calon.by | Соглашение | Публикация статей

Краткие сведения о кодировках кириллицы
Категория: Статьи

В настоящее время существует шесть основных кодировок кириллицы, то есть наборов символов, с помощью которых можно отобразить на web-странице знаки русского алфавита.

ПРИМЕЧАНИЕ
Кодировкой кириллицы называется общепринятый стандарт, включающий набор символов, который позволяет отображать в документах HTML знаки русского алфавита.

Исторически первой возникла кодировка KOI8 (код обмена информации восьмибитный), соответствующая стандарту ГОСТ 19 768-74. Она была разработана в середине семидесятых годов специалистами одного из советских НИИ и к середине восьмидесятых стала базовой кодировкой для только что появившихся тогда в нашей стране русифицированных, совместимых с UNIX операционных систем. Именно благодаря этому на сегодняшний день KOI8 является основным стандартом для серверов, работающих на базе платформы UNIX (например, для HTTP-сервера Apache), а также используется в качестве «формата по умолчанию» при пересылке сообщений электронной почты на русском языке.

Компания Microsoft, создавая программное обеспечение для работы в Интернете, как водится, пошла своим путем, предложив стандарт Microsoft code page 1251 (Windows 1251), получивший чрезвычайно широкое распространение благодаря популярности операционной системы Microsoft Windows и HTTP-сервера Internet Information Server, входящего в комплект поставки Windows NT/2000.

Стандарт Microsoft/IBM code page 866 (альтернативная кодировка DOS) является базовым в операционных системах MS-DOS и OS/2, и потому в настоящее время данная кодировка медленно, но верно утрачивает свои позиции, поскольку даже сам разработчик и производитель DOS, компания Microsoft, отказалась от дальнейшей поддержки этой линии операционных платформ. Тем не менее кодировка жива и по сей день, прежде всего, благодаря тому, что часть пользователей не намерена пока расставаться с браузерами, работающими в среде MS-DOS, а также по той причине, что данный стандарт принят по умолчанию в некоммерческой сети FidoNet.

Кодировка ISO-8859-5 была разработана Комитетом по международным стандартам (International Standards Organization, ISO) и применяется в основном в совместимых с UNIX операционных системах. Поскольку данный набор символов был создан западными специалистами, плохо знакомыми не только с самим русским языком, но и с уже имеющимся многообразием кодировок кириллицы, ISO не получила широкого распространения, однако все же достаточно часто встречается в Интернете и активно поддерживается рядом русскоязычных серверов.

Macintosh CP (MAC) предназначена для использования на компьютерах Apple Macintosh, оснащенных операционной системой MacOS.

Универсальный международный стандарт Unicode (UTF-8) был создан с благородной целью - объединить все существующие на сегодняшний день национальные кодировки в одну. Поскольку для отображения одного символа в Unicode отводится не один байт, как это принято во всех остальных стандартах, а два, данная кодировка включает в себя 65 536 знаков вместо 256. В это число входят не только буквы всех алфавитов мира, как существующих ныне или созданных искусственно, так и уже практически вымерших, но и множество специальных символов - математических, музыкальных, физических. Стандарт Unicode является стандартом по умолчанию в операционной системе Microsoft Windows XP.

Большинство современных серверных программ обладают встроенной функцией автоматического определения кодировки, используемой клиентским программным обеспечением, и перевода текста в необходимый стандарт «на лету». Однако бывают ситуации, когда возможность автоматического распознавания необходимого пользователю набора символов на сервере отключена или попросту отсутствует. В этом случае содержащийся на web-странице или в сообщении электронной почты текст становится нечитаемым и пользователю необходимо переключить текущую кодировку вручную.


Статьи по теме:

Чарльз Бэббидж
Разработка контрольно-информационных инструментов для PADS
Общие сведения по СКС
Информационные ресурсы украинского сегмента Internet
Преимущества ЭС перед человеком - экспертом
Объектная модель Java
Жадный шкаф создателей Spyware в тесте!!
Просмотр графики в Программе просмотра изображений и факсов
ЭВМ V поколения
Что Такое Кодеки И Где Их Можно Скачать
Признаки проявления вируса
Использование загрузочных дискет Microsoft
Укротите вашу регистратуру Windows с програмным обеспечением чистки регистратуры
Компьютер-помощник конструктора
Процессы в операционной системе UNIX
Автоматизации планирования печатного издания под Apple (Mac)
Языки описания сценариев
Программирование контроллера НГМД
Представляя счет медицинское програмное обеспечение - разрешение для медицинских центров
МОНТАЖ ЖГУТОВ В АППАРАТУРЕ
Примеры комплексов CASE-средств
СОСТАВ САПР
Восстановление Windows
Ада и Си
Замена стандартного ядра и HAL
Интерфейс глобальных сетей
Защита регистрации
Windows 7 - Окно В Будущее
Критерий пользователя ЭС
Сброс дисковой системы
Как Выбрать Принтер?
ПЛОТТЕРЫ ПРЯМОГО ВЫВОДА ИЗОБРАЖЕНИЯ
РАЗВИТИЕ ИНФОРМАЦИОННОГО ОБЩЕСТВА
Hесанкционированный доступ к информации, хранящейся в компьютере
Ресурсная и социокультурная концепции информационной среды как пространства социальных коммуникаций
РАЗНОВИДНОСТИ КОМПЬЮТЕРНЫХ ВИРУСОВ
Кому нужны ваши данные?..
Российские национальные IP-сети
Oболочка Gopher
Бесплатный Софт, Быть Или Не Быть
РАСПЕЧАТКА
WordPad: Внедрение специальных объектов
Требования, предъявляемые к техническим средствам ЭВМ
Внедрение Crm Системы Sales Expert 2 В Компании «Сибаэроинж»
Нормативно-техническая документация
Обмен данными через промежуточный файл
Создание эффекта перехода
Политика безопасности Microsoft Internet Explorer
Подсистема оборудования
СОЗДАНИЕ БАЗ ДАННЫХ И ВВОД ДАННЫХ
Задачи, реализуемые на квантовых компьютерах
Internet
Создание и конфигурирование сжатых дисков
WordPad: Выделение текста цветом
Защита посредством назначения прав доступа и атрибутов