ИНФОРМАЦИЯ,    ДИЗАЙН,    ПЕРЕВОДЫ,    РЕКЛАМА   .   .   .
w a p - с а й т
Информационный портал
Сегодня:  
admin@aranea.ru
+79068922256

  aranea.ru || Спецификация HTML 4.01 | 3. О SGML и HTML

3. О SGML и HTML

3.2. Конструкции SGML, используемые в HTML

3.2.1. Элементы
3.2.2. Атрибуты
3.2.3. Специальные символы
3.2.4. Комментарии

Следующие разделы предоставляют вводную информацию о конструкциях SGML, которые используются в HTML.

3.2.1 Элементы

Файл определения типа документа SGML объявляет типы элементов, которые представляют структуры или желаемое поведение. HTML включает типы элементов, которые представляют: параграфы, гипертекстовые связи, списки, таблицы, иллюстрации и т.д.

Каждое объявление типа элемента, обычно, описывает три его части: начальный тег, содержание и конечный тег.

Имя элемента появляется в начальном теге (пишется - <element-name>) и в конечном теге (пишется - </element-name>); обратите внимание на то, что обратная черта (slash) находится перед именем элемента в конечном теге. Например, начальный и конечный тег элемента UL ограничивает пункты списка:

<UL>
<LI><P>...list item 1...
<LI><P>...list item 2...
</UL>

Некоторые типы элементов HTML позволяют авторам опускать конечные теги (например, P и LI). Немногие типы элементов тоже могут позволить опустить начальные теги; например, HEAD и BODY. Файл HTML DTD указывает для каждого типа элемента, требуется ли начальный или конечный тег.

Некоторые типы элементов HTML не имеют содержания. Например, элемент обрыва строки BR не имеет содержания, его роль заключается только в завершении строки текста. Такие пустые элементы никогда не имеют конечных тегов. Файл определения типа документа и текст спецификации указывают, является ли элемент пустым (не имеет содержания), или если он может иметь содержание, то какое содержание является корректным.

Имена элементов всегда не чувствительны к регистру.

Обратитесь к стандарту языка SGML для консультации о правилах управления элементами (например, они должны быть правильно вложены друг в друга, закрыты конечным тегом, соответствующему начальному, все незакрытые вклинившиеся теги с опущенными конечными тегами (раздел 7.5.1), и т.д.).

Например, следующий параграф:

<P>This is the first paragraph.</P>
...a block element...

может быть перезаписан без конечного тега:

<P>This is the first paragraph.
...a block element...

так как начальный тег <P> закрывается следующим блочным элементом. Похожим образом, если параграф включен внутрь блочного элемента, как например:

<DIV>
<P>This is the paragraph.
</DIV>

конечный тег включающего блочного элемента (здесь </DIV>) подразумевает конечный тег открытого начального тега <P>.

Элементы не являются тегами. Некоторые люди обращаются к элементам, как к тегам (например, "the P tag" – "Тег Р"). Помните, что элемент – это одно, а тег (начальный и конечный) – это другое. Например, элемент HEAD всегда присутствует, даже если оба тега HEAD, начальный и конечный, отсутствуют в разметке.

Все типы элементов, объявленных в этой спецификации, указаны в списке элементов.

3.2.2 Атрибуты

Элементы могут иметь связанные свойства, называемые атрибутами, которые, в свою очередь, могут принимать значения (по умолчанию, или установленные авторами или программами). Пары атрибут/значение размещаются перед завершающим символом ">" начального тега элемента. В начальном теге элемента может быть любое количество пар атрибут/значение (корректных), разделенных пробелами. Они могут размещаться в любом порядке.

В следующем примере, атрибут id установлен для элемента H1:

<H1 id="section1">
This is an identified heading thanks to the id attribute
</H1> 

По умолчанию язык SGML требует, чтобы все значения атрибутов были бы ограничены либо двойными кавычками (десятичное значение ASCII - 34), либо одинарными (десятичное значение ASCII - 39). Одинарные кавычки могут быть включены внутрь значения атрибута, когда само значение заключено в двойные кавычки, и наоборот. Авторы могут также использовать числовые замены для предоставления двойных кавычек (& # 3 4 ;) и одинарных (& # 3 9 ;). Для двойных кавычек авторы также могут использовать примитив символа - & q u o t ;.

В определенных случаях авторы могут определять значение атрибута без каких-либо кавычек. Значения атрибутов могут содержать только буквы (a-z и A-Z), цифры (0-9), дефисы (десятичное значение ASCII 45), точки (десятичное значение ASCII - 46), подчеркивание (десятичное значение ASCII - 95) и двоеточие (десятичное значение ASCII - 58). Мы рекомендуем использование кавычек даже тогда, когда есть возможность их не ставить.

Имена атрибутов всегда не чувствительны к регистру.

Значения атрибутов, обычно, не чувствительны к регистру. Определение каждого атрибута в руководстве указывает, является ли его значение чувствительным к регистру.

3.2.3 Специальные символы

Специальные символы (замещающие символы) – это числовые или символьные имена, которые могут включаться в HTML-документ. Они полезны для обращения к редко используемым символам, или к таким, которые трудно или невозможно ввести компьютерным инструментарием. Вы будете встречать такие символы постоянно в этом документе; они начинаются со знака "&" и заканчиваются точкой с запятой (;). Самые простые примеры включают:

  • "& l t ; " представляет знак <.
  • "& g t ; " представляет знак >.
  • "& q u o t ; " представляет символ ".
  • "& # 2 2 9 ; " (десятичный) представляет буку "a" с маленьким кружком над ней.
  • "& # 1 0 4 8 ; " (десятичный) представляет кириллическую заглавную букву "I".
  • "& # x 6 C 3 4 ; " (шестнадцатиричный) представляет китайский символ "вода".

Мы обсудим замещающие символы HTML подробно позже в разделе по набору символов в HTML-документах. Эта спецификация содержит также список специальных символов, которые могут появляться в документах HTML 4.

3.2.4 Комментарии

Комментарии в HTML имеют следующий синтаксис:

<!-- this is a comment -->
<!-- and so is this one,
    which occupies more than one line -->

Между ограничителем открытия объявления разметки ("<!") и ограничителем открытия комментария ("--") пробелы не допустимы, но они разрешается между закрывающим ограничителем комментария ("--") и закрывающим ограничителем объявления разметки (">"). Обычная ошибка – включить строку дефисов ("---") внутри комментария. Авторам следует избегать размещения двух или более соседних дефисов внутри комментариев.

Информация, которая появляется внутри комментариев, не имеет особого значения (например, специальные символы не интерпретируются).

Обратите внимание, что комментарии являются разметкой.


← Назад | Вперед →
Copyright © 2006 -  aranea.ru