XML 和 HTML 文檔的主要的構(gòu)建模塊是元素標(biāo)簽。在本節(jié)內(nèi)容中,我們將講解這些構(gòu)建模塊。
所有的 XML 文檔(以及 HTML 文檔)均由以下簡單的構(gòu)建模塊構(gòu)成:
元素是 XML 以及 HTML 文檔的主要構(gòu)建模塊。
HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。
實例:
<body>some text</body>
<message>some text</message>
屬性可提供有關(guān)元素的額外信息。
屬性總是被置于某元素的開始標(biāo)簽中。屬性總是以名稱/值的形式成對出現(xiàn)的。下面的 "img" 元素?fù)碛嘘P(guān)于源文件的額外信息:
<img src="computer.gif" />
元素的名稱是 "img"。屬性的名稱是 "src"。屬性的值是 "computer.gif"。由于元素本身為空,它被一個 " /" 關(guān)閉。
在 XML 中,一些字符是有特殊的意義的,例如,我們使用 < 表示一個標(biāo)簽的開始符。
實體是用來定義普通文本的變量。實體引用是對實體的引用。
大多數(shù)同學(xué)都了解這個 HTML 實體引用:" "。這個"無折行空格"實體在 HTML 中被用于在某個文檔中插入一個額外的空格。
當(dāng)文檔被 XML 解析器解析時,實體就會被展開。
實體引用 | 字符 |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA 的意思是被解析的字符數(shù)據(jù)(parsed character data)。
可把字符數(shù)據(jù)想象為 XML 元素的開始標(biāo)簽與結(jié)束標(biāo)簽之間的文本。
PCDATA 是會被解析器解析的文本。這些文本將被解析器檢查實體以及標(biāo)記。
文本中的標(biāo)簽會被當(dāng)作標(biāo)記來處理,而實體會被展開。
不過,被解析的字符數(shù)據(jù)不應(yīng)當(dāng)包含任何 &、< 或者 > 字符;需要使用 &、< 以及 > 實體來分別替換它們。
CDATA 的意思是字符數(shù)據(jù)(character data)。
CDATA 是不會被解析器解析的文本。在這些文本中的標(biāo)簽不會被當(dāng)作標(biāo)記來對待,其中的實體也不會被展開。
以上就是關(guān)于 DTD 構(gòu)建模塊的知識,如果你想要了解更多有關(guān) HTML 標(biāo)簽的內(nèi)容,請參考本站的《HTML參考手冊》!
更多建議: