編碼就是轉(zhuǎn)換 Unicode 字符為等價二進(jìn)制表示的過程。XML 處理程序讀取一個 XML 文檔時,它依賴于編碼類型來編碼文檔。因此,我們需要在 XML 聲明中指定編碼類型。
主要有兩種類型的編碼:
UTF 表示 UCS 轉(zhuǎn)換格式,而 UCS 本身的意義是通用字符集。編號 8 或者 16 表示呈現(xiàn)字符的比特數(shù)。它們是 8(一個字節(jié))或者 16(兩個字節(jié))。對于沒有編碼信息的文檔,默認(rèn)使用 UTF-8。
編碼信息包含在 XML 文檔的序言部分。UTF-8 編碼的語法如下:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
UTF-16 編碼語法如下:
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
下面的例子展示了編碼聲明:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
<contact-info>
<name>Tanmay Patil</name>
<company>TutorialsPoint</company>
<phone>(011) 123-4567</phone>
</contact-info>
在上面的 encoding="UTF-8" 示例中,指定使用 8 位表示字符。要使用 16 為表示字符,可以使用 UTF-16 編碼。
使用 UTF-8 編碼的 XML 文件尺寸比 UTF-16 格式的文件更小。