Однажды...
Новости рекламы

23 года тому назад был изобретен самый известный формат преобразования Юникода

Сентябрь 2015

Однажды... - 23 года тому назад был изобретен самый известный формат преобразования Юникода

До появления Юникода широко использовались 8-битные кодировки, главные минусы которых очевидны:

- Всего 255 символов, да и то часть из них не графические;

- Возможность открыть документ не с той кодировкой, в которой он был создан;

- Шрифты необходимо создавать для каждой кодировки.

Так и было решено создать единый стандарт «широкой» кодировки, которая включала бы все символы (при чем сначала хотели в нее включить только обычные символы, но потом «передумали» и начали добавлять и экзотические). Юникод использует 1 112 064 кодовых позиций (больше чем 16 бит).

Формат UTF-8 (Unicode Transformation Format, 8-bit - «формат преобразования Юникода, 8-битный») был изобретен 2 сентября 1992 года Кеном Томпсоном и Робом Пайком.

Сейчас данный формат - один из общепринятых и стандартизированных вариантов кодировок текста, который позволяет хранить символы Юникода.

Стандарт UTF-8 официально закреплен в документах RFC 3629 [7] и ISO/IEC 10646 Annex D. Кодировка нашла широкое применение в UNIX-подобных операционных системах и веб-пространстве.

 

Символы с кодами меньше 128 в нем представляются одним байтом, а так как в Юникоде они повторяют ASCII, то текст, написанный только этими символами, будет являться текстом в ASCII. Символы же с кодами от 128 кодируются 2-мя байтами, с кодами от 2048 - 3-мя, от 65536 - 4-мя. Так можно было бы и до 6-ти байт дойти, но кодировать ими уже ничего.

просмотров 22081
Реклама на сайте:
Реклама на сайте:
0.23