DTD - XML 基礎
XML 和 HTML 文件的主要構建塊是元素。
XML 文件的構建塊
從 DTD 的角度來看,所有 XML 文件都由以下構建塊組成
- 元素
- 屬性
- 實體
- PCDATA
- CDATA
元素
元素是 XML 和 HTML 文件的主要構建塊。
HTML 元素的示例是 "body" 和 "table"。XML 元素的示例可以是 "note" 和 "message"。元素可以包含文字、其他元素,或者為空。空 HTML 元素的示例是 "hr"、"br" 和 "img"。
示例
<body>some text</body>
<message>some text</message>
屬性
屬性為元素提供額外資訊。
屬性始終放在元素的開始標籤內。屬性始終成對出現,即名稱/值對。下面的 "img" 元素具有關於原始檔的附加資訊
<img src="computer.gif" />
元素的名稱是 "img"。屬性的名稱是 "src"。屬性的值是 "computer.gif"。由於元素本身為空,因此用 "/" 閉合。
實體
某些字元在 XML 中具有特殊含義,例如小於號 (<) 定義了 XML 標籤的開始。
你們大多數人都知道 HTML 實體: " "。這個 "不間斷空格" 實體在 HTML 中用於在文件中插入額外的空格。當 XML 解析器解析文件時,實體會被展開。
XML 中預定義了以下實體
實體引用 | 字元 |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA 表示可解析字元資料。
將字元資料視為 XML 元素開始標籤和結束標籤之間的文字。
PCDATA 是將被解析器解析的文字。文字將被解析器檢查實體和標記。
文字中的標籤將被視為標記,實體將被展開。
但是,可解析字元資料不應包含任何 &、< 或 > 字元;它們分別需要用 &、< 和 > 實體表示。
CDATA
CDATA 表示字元資料。
CDATA 是不會被解析器解析的文字。文字中的標籤不會被視為標記,實體也不會被展開。