Наверное каждый, кто когда либо
пользовался компьютером встречался такой проблемой, когда вместо русских букв у вас на
экране видна какая-то белиберда.
Я решил найти корни этой проблемы и описать вам, мой читатель, историю кодовых таблиц.
Вообще, в кодовой таблице можно представить 256 символов: различных букв, цифр, управляющих кодов. Первая часть таблицы с 0 по 127 символ
стандартизирована американским стандартом ASCII(American Standart Code for Information Interchange) А вот вторая...! Отсюда и начинаются проблемы. Дело в том, что
вторая часть таблицы предназначена для размещения национальных алфавитов и других служебных символов. Неопределенная четким стандартом, она различна
для разных операционных систем, программ и т.д. Так для русского языка(кириллицы) в DOS, например, используется кодовая страница( так
называют вторую часть таблицы ASCII, с 128 по 255 символ) под номером 866, а под Windows уже другая, под номером 1251. Это происходит из-за того,
что после пришествия графической оболочки, можно было отказаться от псевдографики, которая занимала
чуть ли не половину страницы DOS.
Для русского языка существуют и другие таблицы(подчеркиваю не страницы, а таблицы). Одна из первых
появившихся была КОИ-7, аббревиатура "КОИ"
расшифровывается как "Код для Обмена Информацией", а цифра семь - количество битов для шифровки одного символа. Семь битов использовалось для того,
чтобы сократить время передачи символа, во внутренних сетях все получалось, но при выходе во внешний мир из-за дополнительной информации размер
одного символа вырос аж до 3 байт, что не сокращало, а
увеличивало время загрузки. Поэтому появляется более совершенная таблица КОИ-8( в
англоязычном варианте KOI8-R), здесь, как видно из названия, один символ это один байт. Проблему с передачей удалось решить, но возникла другая,
проблема с позиционированием клавиатуры(раскладки). Писать в этой кодировке можно только в
специализированных редакторов.
Кому-то видимо все это надоело и он решил(по-настоящему решение было принято на консорциуме фирм) создать кодовую таблицу, где будет не только
сам символ, но и инструкция как его надо воспроизводить, то есть каждый символ - два байта. Такая таблица получила название Unicode. Хоть объем
информации и увеличился вдвое, зато исчезли проблемы с неправильным воспроизведением.
Ну и несколько слов о программах, которые работают с разными кодировками. В двух известных броузерах, Internet Explorer-е и в Netscape Navigator-е
в меню "Вид", в подменю "Кодировки"(в IE "Шрифты") находяться стандартный набор кодировок для того, чтобы находу перекодировать web-страницы. Из почтовых
программах могу отметить The Bat, под правый клик мыши выскакивает меню -> подменю "Перекодировка" с набором стандартных кодировок. Самым удобным
на мой взгляд текстовым редактором работающим со всеми кодировками является Bred(статью о нем читайте здесь). Еще одна альтернатива стандартному
Блокноту, программа Shtirlitz. В ней столько функций, что хватит всем за глаза и за уши, возможность автоматического распознования и функция
перекодировки HTML -> TXT и еще много других функции. В общем скачайте не пожалеете.