ИНФОРМАЦИЯ,    ДИЗАЙН,    ПЕРЕВОДЫ,    РЕКЛАМА   .   .   .
w a p - с а й т
Информационный портал
Сегодня:  
admin@aranea.ru
+79068922256

  aranea.ru || Спецификация HTML 4.01 | 5. Представление документа HTML

5. Представление документа HTML

5.3. Специальные символы

5.3.1. Числовые специальные символы
5.3.2. Специальные символьные примитивы

Определенная кодировка символов может быть неспособной выразить все символы из их наборов в документе. Для таких кодировок или, когда аппаратные средства или конфигурация программного обеспечения не позволяют пользователям вводить некоторые символы в документ напрямую, авторы могут использовать специальные символы языка SGML. Специальные символы являются механизмом, независимым от кодировки символов, для ввода любого символа из набора символов документа.

Специальные символы в HTML могут появляться в двух формах:

  • Числовые специальные символы (либо десятичные, либо шестнадцатеричные).
  • Символьные примитивы.

Специальные символы внутри комментариев не имеют особого значения; они являются только данными комментария.

Обратите внимание. HTML предоставляет другие способы для отражения символьных данных, в частности - внутристрочные изображения.

Обратите внимание. В языке SGML можно исключать завершающий символ ";" после специального символа в некоторых случаях (например, в разрыве строки или непосредственно перед тегом). В других условиях это не возможно (например, в середине слова). Мы строго рекомендуем использовать ";" во всех случаях для избегания проблем с устройствами вывода, которые требуют наличия этого символа.

5.3.1 Числовые специальные символы

Числовые специальные символы определяют кодовую позицию символа в наборе символов документа.

Числовые специальные символы могут принимать две формы:

  • Синтаксис "&#D;", где D – это десятичное число, обращается к десятичному числу D номера символа ISO 10646.
  • Синтаксис "& # x H ;" или "& # X H ;", где H – это шестнадцатиричное число, обращается к шестнадцатиричному числу H номера символа ISO 10646. Шестнадцатиричные числа в числовых специальных символах не чувствительны к регистру.

Ниже приведены примеры с числовыми специальными символами:

  • & # 2 2 9 ; (десятичный) представляет букву "a" с маленьким кружком над ней (используемый, например, в Норвегии).
  • & # x E 5 ; (шестнадцатиричный) представляет тот же самый символ.
  • & # X e 5 ; (шестнадцатиричный) представляет тоже тот же самый символ.
  • & # 1 0 4 8 ; (десятичный) представляет кириллическую заглавную букву "I".
  • & # x 6 C 3 4 ; (шестнадцатиричный) представляет китайский символ воды.

Обратите внимание. Хотя шестнадцатиричное представление не определено в [ISO8879], оно ожидается в ревизии, как описано в [WEBSGML]. Это соглашение удобно, так как стандарты символов обычно используют шестнадцатиричное представление.

5.3.2 Специальные символьные примитивы

Чтобы дать авторам более интуитивный способ обращения к символам в наборе символов документа, HTML предлагает набор символьных примитивов. Символьные примитивы используют символьные имена, так что авторам не надо запоминать кодовую позицию. Например, символьный примитив & a r i n g ; обращается к строчному символу "a" с кружком над ней; "& a r i n g ; " легче запомнит, чем & # 2 2 9 ; .

HTML 4 не определяет символьные примитивы для каждого символа в наборе символов документа. Например, нет символьных примитивов для кириллической заглавной буквы "I". Обратитесь к полному списку специальных символов, определенных в HTML 4.

Символьные примитивы чувствительны к регистру. Таким образом, & A r i n g ; обращается к другому символу (заглавная A с кружочком), чем - & a r i n g ; (строчная a с кружочком).

Четыре символьных примитива заслуживают специальное упоминание, так как они часто используются для обхода определенных символов:

  • "& l t ;" представляет знак <.
  • "& g t ;" представляет знак >.
  • "& a m p ;" представляет знак &.
  • "& q u o t; представляет знак ".

Авторам, желающим разместить символ "<" в тексте, следует использовать "& l t ;" (десятичное значение 60 ASCII) для избегания возможной путаницы с началом тега (открывающий ограничитель начального тега). Похожим образом, авторам следует использовать "& g t ;" (десятичное значение 62 ASCII) в тексте вместо ">" для избегания проблем со старыми устройствами вывода, которые некорректно выводят этот символ, как окончание тега (закрывающий ограничитель тега), когда он появляется в значениях атрибута, заключенных в кавычки.

Авторам следует использовать "& a m p ;" (десятичное значение 38 ASCII) вместо "&" для избегания путаницы с началом специального символа (открывающий ограничитель примитива). Авторам следует также использовать "& a m p ;" в значениях атрибута, так как специальные символы разрешены внутри значений атрибутов CDATA.

Некоторые авторы используют символьные примитивы "& q u o t ;" для кодировки примеров двойных кавычек ("), так как символ может использоваться для ограничения значений атрибутов.


← Назад | Вперед →
Copyright © 2006 -  aranea.ru