鍍金池/ 教程/ HTML/ XML 編碼
XML 屬性
XML 語法
XML 注釋
XML 文檔對象模型
XML 數(shù)據(jù)庫
XML 樹結(jié)構(gòu)
XML 文檔類型定義(DTDs)
XML 之 CDATA 片段
XML 解析器
XML 編輯器
XML 概述
XML 字符實體
XML 編碼
XML 驗證
XML 文檔
XML 聲明
XML 元素
XML 命名空間
XML 閱讀器
XML 處理程序
XML 模式
XML 空白
XML 標(biāo)簽
XML 處理指令

XML 編碼

編碼就是轉(zhuǎn)換 Unicode 字符為等價二進(jìn)制表示的過程。XML 處理程序讀取一個 XML 文檔時,它依賴于編碼類型來編碼文檔。因此,我們需要在 XML 聲明中指定編碼類型。

編碼類型

主要有兩種類型的編碼:

  • UTF-8
  • UTF-16

UTF 表示 UCS 轉(zhuǎn)換格式,而 UCS 本身的意義是通用字符集。編號 8 或者 16 表示呈現(xiàn)字符的比特數(shù)。它們是 8(一個字節(jié))或者 16(兩個字節(jié))。對于沒有編碼信息的文檔,默認(rèn)使用 UTF-8。

語法

編碼信息包含在 XML 文檔的序言部分。UTF-8 編碼的語法如下:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

UTF-16 編碼語法如下:

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

示例

下面的例子展示了編碼聲明:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
    <name>Tanmay Patil</name>
    <company>TutorialsPoint</company>
    <phone>(011) 123-4567</phone>
</contact-info>

在上面的 encoding="UTF-8" 示例中,指定使用 8 位表示字符。要使用 16 為表示字符,可以使用 UTF-16 編碼。

使用 UTF-8 編碼的 XML 文件尺寸比 UTF-16 格式的文件更小。

上一篇:XML 處理指令