Utf 8 таблица символов
Автор OTA FAK MAZOFAK задал вопрос в разделе Интернет
что такое UTF-8 и получил лучший ответ
Ответ от Svlel[гуру]
UTF-8 (от англ. Unicode Transformation Format — формат преобразования Юникода) — в настоящее время распространённая кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста.
Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байтов (реально только до 4 байт, поскольку использование кодов больше 221 не планируется) , в которых первый байт всегда имеет вид 11xxxxxx, а остальные — 10xxxxxx.
Проще говоря, в формате UTF-8 символы латинского алфавита, знаки препинания и управляющие символы ASCII записываются кодами US-ASCII, a все остальные символы кодируются при помощи нескольких октетов со старшим битом 1. Это приводит к двум эффектам.
* Даже если программа не распознаёт Юникод, то латинские буквы, арабские цифры и знаки препинания будут отображаться правильно.
* В случае, если латинские буквы и простейшие знаки препинания (включая пробел) занимают существенный объём текста (например, в европейских языках, включая основанные на кириллице) , UTF-8 даёт выигрыш по объёму по сравнению с UTF-16.[1][2]
* На первый взгляд может показаться, что UTF-16 удобнее, так как в ней большинство символов кодируется ровно двумя байтами. Однако это сводится на нет необходимостью поддержки суррогатных пар, о которых часто забывают при использовании UTF-16, реализовывая лишь поддержку символов UCS-2.[1]
Формат UTF-8 был изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком и реализован в Plan 9[3]. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.Источник:
UTF-8 (
Что такое кодировка документов а сервере windows-1251 bkb utf-8?и чем это поможет при оптимизации сайта?
кодировка - это таблица соответствий двоичных чисел символам алфавита.
Windows1251 - это
подробнее...
сколько байт требуется на один символ ?
Для ответа на ваш вопрос нужно определиться, что такое символ. Если это аглицкая буква, то 1 байта
подробнее...
Кто Знает код для записи рускоого текста в XML, или как заменить Латиницу на Кирилицу в xml ???Зарание Спасибо ))))
В самой первой строке XML всегда указана кодировка - вот в ней и надо по-русски писать.
подробнее...
Перевод двоичного кода в текст
Что бы было понятнее:
Есть так называемые кодировки (ANCii, Windows-1251, UTF-8, Unicode и т.
подробнее...
как поставить степень числа?
В Блокноте тоже можно -- используйте Таблицу символов и сохраните файл в кодировке UTF-8
подробнее...
Русский шрифт не хочет нормально отображаться в html.
Кодировку установите UTF-8 и в такой же сохраняйте
подробнее...
что такое Unicode
один из видов кодировки. Перевода символов в цифровые коды. Этих кодировок сейчас уже несколько
подробнее...
Неправильное отображение HTML письма
Конверти в PDF и не занимайся ерундой.
Или оформляй как сайт и кидай ссылку.
подробнее...
сколко баит 1 символ ?
Это зависит от кодировки символов.
В кодировке ASCII, например, каждый символ равен одному
подробнее...
Чем отличаются кодировки utf8,utf8_bin,utf8_general_ci,utf8_unicode_ci? Какую лучше выбрать для данных на разных языках?
utf8 - это charset, способ хранения символов из набора unicode. От одного байта до трёх на один
подробнее...
Какие есть основные международные системы кодирования?(пару слов о них)ASCII, Unicode...
Уууу их оооочень много.
Уникод считается надеждой, этакой кодировкой будущего, т. к. способен
подробнее...