XML 語法規則
XML 的語法規則非常簡單和邏輯化。這些規則易於學習和使用。
XML 文件必須有一個根元素
XML 文件必須包含一個作為所有其他元素的父元素的根元素
<root>
<child>
<subchild>.....</subchild>
</child>
</root>
在此示例中,<note> 是根元素
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
XML 宣告
這行被稱為 XML 宣告
<?xml version="1.0" encoding="UTF-8"?>
XML 宣告是可選的。如果存在,它必須是文件的第一行。
XML 文件可以包含國際字元,例如挪威語的 øæå 或法語的 êèé。
為避免錯誤,您應該指定所使用的編碼,或將 XML 檔案儲存為 UTF-8。
UTF-8 是 XML 文件的預設字元編碼。
字元編碼可以在我們的字元集教程中學習。
UTF-8 也是 HTML5、CSS、JavaScript、PHP 和 SQL 的預設編碼。
所有 XML 元素必須有結束標籤
在 XML 中,省略結束標籤是違法的。所有元素必須有結束標籤
<p>這是一個段落。</p>
<br />
注意: XML 宣告沒有結束標籤!這不是錯誤。宣告不是 XML 文件的一部分。
XML 標籤區分大小寫
XML 標籤區分大小寫。標籤 <Letter> 與標籤 <letter> 不同。
開始標籤和結束標籤必須使用相同的大小寫
<message>這是正確的</message>
"開始標籤和結束標籤" 通常被稱為 "起始標籤和末尾標籤"。使用您喜歡的任何一種說法。它們是完全相同的事物。
XML 元素必須正確巢狀
在 HTML 中,您可能會看到不正確巢狀的元素
<b><i>這段文字是粗體和斜體</b></i>
在 XML 中,所有元素必須正確巢狀
<b><i>這段文字是粗體和斜體</i></b>
在上面的示例中,“正確巢狀”僅僅意味著由於 <i> 元素在 <b> 元素內部開啟,它也必須在 <b> 元素內部關閉。
XML 屬性值必須始終加引號
XML 元素可以像 HTML 一樣具有名稱/值對的屬性。
在 XML 中,屬性值必須始終加引號
<note date="12/11/2007">
<to>Tove</to>
<from>Jani</from>
</note>
實體引用
某些字元在 XML 中具有特殊含義。
如果您將 "<" 等字元放在 XML 元素中,它將生成錯誤,因為解析器會將其解釋為新元素的開始。
這將生成一個 XML 錯誤
<message>salary < 1000</message>
為避免此錯誤,請將 "<" 字元替換為實體引用
<message>salary < 1000</message>
XML 中有 5 個預定義的實體引用
< | < | 小於 |
> | > | 大於 |
& | & | 和號 |
' | ' | 撇號 |
" | " | 引號 |
只有 < 和 & 在 XML 中是嚴格非法的,但最好也用 > 替換 >。
XML 中的註釋
XML 中編寫註釋的語法與 HTML 類似
<!-- 這是一個註釋 -->
註釋中間不允許出現兩個破折號
<!-- 這是一個無效的 -- 註釋 -->
XML 中的空白被保留
XML 不會截斷多個空白(HTML 會將多個空白截斷為一個空白)
XML | Hello Tove |
HTML | Hello Tove |
XML 將換行符儲存為 LF
Windows 應用程式將換行符儲存為:回車符和換行符 (CR+LF)。
Unix 和 Mac OS X 使用 LF。
舊 Mac 系統使用 CR。
XML 將換行符儲存為 LF。
格式良好的 XML
符合上述語法規則的 XML 文件被稱為“格式良好的”XML 文件。