Символы, представленные в Юникоде

Символы, представленные в Юникоде

В Юникоде зарезервировано 1 112 064 (= 220 + 216 − 211) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859-1 («Латиница-1»).

Кодовое пространство разделено на 17 «плоскостей» по 65 536 (= 216) символов:

  • Плоскость 0 (0000—FFFF): Базовая многоязыковая плоскость (Basic Multilingual Plane, BMP)
  • Плоскость 1 (10000—1FFFF): Дополнительная многоязыковая плоскость (Supplementary Multilingual Plane, SMP)
  • Плоскость 2 (20000—2FFFF): Дополнительная иероглифическая плоскость (Supplementary Ideographic Plane, SIP)
  • Плоскость 3 (30000—3FFFF): Третичная иероглифическая плоскость (Tertiary Ideographic Plane, TIP)
  • Плоскости 4—13 (40000—DFFFF) не используются
  • Плоскость 14 (E0000—EFFFF): Дополнительная плоскость особого назначения (Supplementary Special-purpose Plane, SSP)
  • Плоскость 15 (F0000—FFFFF) используется как дополнительная область-A для частного использования (Supplementary Private Use Area-A, SPUA-A)
  • Плоскость 16 (100000—10FFFF) используется как дополнительная область-B для частного использования (Supplementary Private Use Area-B, SPUA-B)

Содержание

Базовая многоязыковая плоскость

Базовая плоскость UNICODE

Базовая плоскость UNICODE
Чёрный — расширенный латинский алфавит;
Голубой — лингвистические символы международного фонетического алфавита IPA;
Синий — другие европейские алфавиты;
Оранжевый — письменности Ближнего Востока;
Светло-оранжевый — письменности Африки;
Зелёный — письменности Южной Азии;
Фиолетовый — письменности Юго-восточной Азии;
Красный — письменности Восточной Азии;
Розовый — унифицированные китайско-японско-корейские символы;
Жёлтый — письменности аборигенов Северной Америки;
Пурпурный — символы;
Тёмно-серый — диакритики;
Светло-серый — суррогатные пары UTF-16 и области для частного использования;
Циан — другие знаки;
Белый — не используется.

Плоскость 0 (Основная многоязыковая плоскость, англ. Basic Multilingual Plane, BMP) содержит символы практически для всех современных письменностей и большое число специальных символов. Большая часть таблицы занята китайско-японскими иероглифами и своеобразными корейскими буквами.

В Unicode 5.2 в этой плоскости представлены следующие наборы символов:

Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Дополнительная многоязыковая плоскость

Плоскость 1 (дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена, в первую очередь, для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.

Дополнительная многоязыковая плоскость разделена на следующие поддиапазоны:

  • U+10000—U+100FF Линейное письмо Б
  • U+10100—U+1018F Древние системы счисления
  • U+10190—U+107FF Алфавиты, слоговые письменности и наборы символов с направлением письма слева направо
  • U+10800—U+10FFF Алфавиты и слоговые письменности с направлением письма справа налево
  • U+11000—U+11D7F Брахмические письменности
  • U+11D80—U+12FFF Клинопись и другие древние письменности
  • U+13000—U+15BFF Иероглифы древних египтян и майя
  • U+15C00—U+15FFF Ацтекские пиктограммы
  • U+16000—U+167FF Вновь созданные письменности
  • U+16800—U+16FFF Африканские и другие письменности
  • U+17000—U+1B4FF Большие азиатские письменности
  • U+1B500—U+1BBFF Протоэламская письменность
  • U+1BC00—U+1BFFF Стенография
  • U+1C000—U+1CA7F Иероглифы микмак
  • U+1CA80—U+1CDFF Ронго-ронго
  • U+1CE00—U+1CFFF Не используется
  • U+1D000—U+1DFFF Системы условных обозначений
  • U+1E000—U+1E7FF Не используется
  • U+1E800—U+1EFFF Письменности с направлением справа налево
  • U+1F000—U+1F0FF Игровые символы
  • U+1F100—U+1F2FF Наборы буквенно-цифровых и иероглифических символов
  • U+1F300—U+1F7FF Наборы пиктограмм
  • U+1F800—U+1FFFF Не используется

В Unicode 5.2 в этой плоскости представлены следующие наборы символов:

  • Брахмические письменности:
  • Клинопись и другие древние письменности:
  • Иероглифы древних египтян и майя:
  • Системы условных обозначений:
  • Игровые символы:
  • Наборы буквенно-цифровых и иероглифических символов:
    • Набор дополнительных вложенных буквенно-цифровых символов (1F100-1F1FF)
    • Набор дополнительных вложенных иероглифических символов (1F200-1F2FF)

Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Дополнительная иероглифическая плоскость

Плоскость 2 (Дополнительная иероглифическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.

В Unicode 5.2 в этой плоскости представлены следующие наборы иероглифов:

Наборы иероглифов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Третичная иероглифическая плоскость

Плоскость 3 (Третичная иероглифическая плоскость, англ. Tertiary Ideographic Plane, TIP) зарезервирована для архаичных китайских иероглифов.

Третичная иероглифическая плоскость предварительно разделена на следующие поддиапазоны:

В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:

  • в диапазон U+30000—U+317FF — древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях черепах и костях животных.
  • в диапазон U+32000—U+32FFF — иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах.
  • в диапазон U+34000—U+368FF — иероглифы в стиле «малая печать» (сяочжуань, 小篆).

В будущем также предполагается включить наборы иероглифов Периода Сражающихся царств.

В настоящее время в Консорциуме Юникод поставлен вопрос о будущем названии плоскости 3.

Дополнительная плоскость особого назначения

Плоскость 14 (Дополнительная плоскость особого назначения, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.

В Unicode 5.2 в этой плоскости представлены следующие наборы символов:

  • Символы тегов (E0000—E007F)
  • Дополнительные селекторы вариантов начертания (E0100—E01EF)

Области для частного использования

Некоторые диапазоны Юникода выделены для частного использования и экспериментов. Они включают:

  • Частную область в Базовой многоязыковой плоскости U+E000—U+F8FF
  • Дополнительные плоскости 15 (U+F0000—U+FFFFF) и 16 (U+100000—U+10FFFF)

Ссылки

Кодировки символов
Основы → алфавиттекстфайлданные ) • набор символов • конверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУППRADIX-50EBCDICДКОИ-8 ) • КОИ-7ISO 646
совре-
менное
8-битное
представ-
ление
символы ASCIIуправляющиепечатные ) не-ASCII ( псевдографика )
8бит. код.стр. Разные →   Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437850852855866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-
байтные
Традиционные → DBCSGB2312 ) • HTML
Unicode → UTF-16UTF-8список символовкириллица )
Связанные
темы →
интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифты • текст как изображение Утилиты: iconvrecode

Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "Символы, представленные в Юникоде" в других словарях:

  • Символы представленные в Юникоде — …   Википедия

  • Представленные в Юникоде Символы — В Юникоде зарезервировано 1 114 112 (= 220 + 216) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859 1 («Латиница 1»). Кодовое пространство разделено на 17 «плоскостей» по… …   Википедия

  • Символы — (За гранью возможного) Символы, представленные в Юникоде Символы джокеры Все статьи, начинающиеся с Символы …   Википедия

  • Юникод — Юникод[1] или Уникод[2] (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков …   Википедия

  • UCS-4 — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UNICODE — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF-32LE — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF-32 Little Endian — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF-7 — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»