本章介紹了 XML 字符實(shí)體。在我們了解字符實(shí)體之前,先了解一下什么是 XML 實(shí)體。
W3 聯(lián)盟 對(duì)實(shí)體的定義如下:
文檔實(shí)體作為實(shí)體樹的根元素和 XML 處理程序的起點(diǎn)。
這意味著實(shí)體就是 XML 中的占位符。它們可以聲明在文檔序言或者DTD中。實(shí)體有不同的類型,本章后面會(huì)討論字符實(shí)體。
HTML 和 XML 都有一些符號(hào)被保留使用,它們不能在 XML 代碼中用作內(nèi)容。例如,< 和 > 符號(hào)被用作 XML 標(biāo)簽的開頭和結(jié)尾。要顯示這些特殊字符,就要使用字符實(shí)體。
有些特殊的字符或符號(hào)還不能直接使用鍵盤輸入??梢允褂米址麑?shí)體來(lái)顯示這些符號(hào)或特殊字符。
有三種類型的字符實(shí)體:
引入它們是為了避免使用某些有歧義的符號(hào)。例如,當(dāng)我們把小于(<)或大于(>)符號(hào)當(dāng)尖括號(hào)(<>)使用時(shí)就會(huì)產(chǎn)生歧義。字符實(shí)體從根本上來(lái)說(shuō)就是用來(lái)界定 XML 標(biāo)簽的。下面是一個(gè)來(lái)自 XML 規(guī)范的預(yù)定義字符實(shí)體列表。它們可以用來(lái)表示某些字符而不帶歧義。
數(shù)字引用被用來(lái)表示字符實(shí)體。數(shù)字引用可以是十進(jìn)制或十六進(jìn)制格式。由于有數(shù)以千記的數(shù)字引用,導(dǎo)致很難記住它們。數(shù)字引用通過(guò)使用字符在 Unicode 字符集中的編碼數(shù)值來(lái)表示。
十進(jìn)制數(shù)字引用基本語(yǔ)法:
&# decimal number ;
十六進(jìn)制數(shù)字引用基本語(yǔ)法:
&#x Hexadecimal number ;
下面的表格列出了一些預(yù)定義字符實(shí)體和它們對(duì)應(yīng)的數(shù)值:
實(shí)體名稱 | 字符 | 十進(jìn)制引用 | 十六進(jìn)制引用 |
---|---|---|---|
quot | " | " | " |
amp | & | & | & |
apos | ' | ' | ' |
lt | < | < | |
gt | > | > | > |
正如上面所說(shuō)的,數(shù)值字符很難記住,最受歡迎的字符實(shí)體類型是命名字符實(shí)體。因?yàn)槊總€(gè)實(shí)體都用一個(gè)名稱標(biāo)識(shí)。
例如: