ИНФОРМАЦИЯ,    ДИЗАЙН,    ПЕРЕВОДЫ,    РЕКЛАМА   .   .   .
w a p - с а й т
Информационный портал
Сегодня:  
admin@aranea.ru
+79068922256

  aranea.ru || Спецификация HTML 4.01 | 5. Представление документа HTML

5. Представление документа HTML

В этой главе мы обсуждаем, каким образом HTML-документ отображается на компьютере и в Интернете.

Раздел о наборе символов документа связан с вопросом, какие абстрактные символы может содержать HTML-документ. Символы включают латинскую букву "A", кириллическую букву "I", китайский символ, означающий "воду", и т.д.

Раздел о кодировке символов связан с вопросом, как эти символы могут представляться в файле или во время передачи через Интернет. Так как некоторые кодировки символов не могут непосредственно отобразить все символы, которые автор может захотеть включить в документ, HTML предлагает механизмы для вывода любого символа (которые называются специальными символами).

Поскольку в естественных языках существует большое количество символов и огромное разнообразие способов представления этих символов, необходимо проявлять осторожность, чтобы документы могли быть поняты устройствами вывода по всему миру.

5.1. Набор символов документа

Для обеспечения взаимодействия язык SGML требует, чтобы каждое приложение (включая HTML) определяло набор символов документа. Набор символов документов включает:

  • Набор: Набор абстрактных символов, таких как латинская буква "A", кириллическая буква "I" и китайский символ, означающий "вода", и т.д.
  • Кодовая позиция: Ряд целых значений для символов в наборе.

Каждый SGML-документ (включая каждый HTML-документ) является последовательностью символов из набора. Компьютерные системы идентифицируют каждый символ по его кодовой позиции; например, в наборе символов ASCII кодовые позиции 65, 66 и 67 относятся к символам 'A', 'B' и 'C', соответственно.

Набора символов ASCII не достаточно для глобальной информационной системы, подобной сети Web, поэтому HTML использует полный набор символов, называемый "Универсальный набор символов" (Universal Character Set (UCS) ), определенный в [ISO10646]. Этот стандарт определяет набор из тысячи символов, используемых сообществом по всему миру.

Набор символов, определенных в [ISO10646], - это посимвольный эквивалент для "Уникода" Unicode ([UNICODE]). Оба этих стандарта время от времени обновляются с включением новых символов, поэтому необходимо просматривать исправления на соответствующих сайтах в сети Web. В текущей спецификации используется [ISO10646] для ссылок на набор символов документа, а [UNICODE] резервируется для обращения к двухстороннему текстовому алгоритму Unicode.

Набора символов документа не достаточно для корректной интерпретации HTML-документа устройством вывода, так как символы при обмене кодируются как последовательность битов в файле или во время передачи в сети. Устройства вывода должны также узнавать определенную кодировку символов, которая использовалась для передачи потока символов документа в потоке битов.


← Назад | Вперед →
Copyright © 2006 -  aranea.ru