23 года тому назад был изобретен самый известный формат преобразования Юникода
Сентябрь 2015
До появления Юникода широко использовались 8-битные кодировки, главные минусы которых очевидны:
- Всего 255 символов, да и то часть из них не графические;
- Возможность открыть документ не с той кодировкой, в которой он был создан;
- Шрифты необходимо создавать для каждой кодировки.
Так и было решено создать единый стандарт «широкой» кодировки, которая включала бы все символы (при чем сначала хотели в нее включить только обычные символы, но потом «передумали» и начали добавлять и экзотические). Юникод использует 1 112 064 кодовых позиций (больше чем 16 бит).
Формат UTF-8 (Unicode Transformation Format, 8-bit - «формат преобразования Юникода, 8-битный») был изобретен 2 сентября 1992 года Кеном Томпсоном и Робом Пайком.
Сейчас данный формат - один из общепринятых и стандартизированных вариантов кодировок текста, который позволяет хранить символы Юникода.
Стандарт UTF-8 официально закреплен в документах RFC 3629 [7] и ISO/IEC 10646 Annex D. Кодировка нашла широкое применение в UNIX-подобных операционных системах и веб-пространстве.
Символы с кодами меньше 128 в нем представляются одним байтом, а так как в Юникоде они повторяют ASCII, то текст, написанный только этими символами, будет являться текстом в ASCII. Символы же с кодами от 128 кодируются 2-мя байтами, с кодами от 2048 - 3-мя, от 65536 - 4-мя. Так можно было бы и до 6-ти байт дойти, но кодировать ими уже ничего.
Рекламы, PR и Маркетинга вы можете ознакомиться
на страницах журнала "Практика Рекламы"
Март 2024 - Однажды...Февраль 2024 - Однажды...
Январь 2024 - Однажды...
Декабрь 2023 - Однажды...
Ноябрь 2023 - Однажды...
Октябрь 2023 - Однажды...