XML 輕松學(xué)習(xí)手冊(cè)(比較不錯(cuò))
來源:易賢網(wǎng) 閱讀:1724 次 日期:2014-08-10 17:11:51
溫馨提示:易賢網(wǎng)小編為您整理了“XML 輕松學(xué)習(xí)手冊(cè)(比較不錯(cuò))”,方便廣大網(wǎng)友查閱!

我想就我個(gè)人學(xué)習(xí)過程的心得和經(jīng)驗(yàn),寫一篇比較全面的介紹文章。

首先有兩點(diǎn)是需要肯定的:

第一:XML肯定是未來的發(fā)展趨勢(shì),不論是網(wǎng)頁(yè)設(shè)計(jì)師還是網(wǎng)絡(luò)程序員,都應(yīng)該及時(shí)學(xué)習(xí)和了解,等待只會(huì)讓你失去機(jī)會(huì);

第二:新知識(shí)肯定會(huì)有很多新概念,嘗試?yán)斫夂徒邮埽趴赡芴岣?。不要害怕和逃避,畢竟我們還年輕。

提綱

本文共分五大部分。分別是XML快速入門,XML的概念,XML的術(shù)語(yǔ),XML的實(shí)現(xiàn),XML的實(shí)例分析。最后附錄介紹了XML的相關(guān)資源。作者站在普通網(wǎng)頁(yè)設(shè)計(jì)人員的角度,用平實(shí)生動(dòng)的語(yǔ)言,向您講述XML的方方面面,幫助你撥開XML的神秘面紗,快速步入XML的新領(lǐng)域。

XML初學(xué)者普遍存在的問題

1。XML是什么?(不要說是可擴(kuò)展的標(biāo)記語(yǔ)言之類的話)

2。XML可以做什么?怎么做?(不需要回答,只需要列舉出一個(gè)簡(jiǎn)單的例子即可)

1: XML,是用來描迷數(shù)據(jù)的.

2:舉一個(gè)例子說明:有A數(shù)據(jù)庫(kù) B數(shù)據(jù)庫(kù),他們之間的標(biāo)準(zhǔn)不同,不能互傳.那么你可以把數(shù)據(jù)放在XML中,而后就可以讓A,B之間可以共同傳輸數(shù)據(jù)了.

補(bǔ)充:

首先要有一個(gè)概念,你最好不要去用XML設(shè)計(jì)網(wǎng)頁(yè),不是說不可以, 只是要說明,XML不是HTML的替代.

有了這個(gè)概念,就不會(huì)有很多的看完一個(gè)一個(gè)的教程,還不知道XML做什么,很明了

XML就是為了描述數(shù)據(jù)

開始學(xué)習(xí)XML:

1.工具:XMLSPY2005,

2.學(xué)習(xí)XML從那里開始?

即我要說明的是:先寫XML還是先寫DTD或是XML Schemas.

大多的教程從XML說起,再說DTD...再說XML Schemas...

不過我個(gè)人覺的,先了解一下XML的基本語(yǔ)法,而后跳過DTD,從Schemas開始.

這樣不會(huì)讓DTD搞的沒興趣..而后再對(duì)DTD作一定了解.這里要說明,我覺的先寫

好一個(gè)Schemas再寫XML比較好.即,先建立模型.再去填數(shù)據(jù).

第一章:XML快速入門

一. 什么是XML?

二. XML是新概念嗎?

三. 使用XML有什么好處?

四. XML很難學(xué)嗎?

五. XML和HTML的區(qū)別

六. XML的嚴(yán)格格式

七. 關(guān)于XML的更多

一. 什么是XML?

這往往是第一個(gè)問題,也往往在第一個(gè)問題上你就會(huì)搞不明白,因?yàn)榇蠖嗟慕滩纳线@樣回答:

XML是Extensible Markup Language的簡(jiǎn)寫,一種擴(kuò)展性標(biāo)識(shí)語(yǔ)言。 這是標(biāo)準(zhǔn)的定義。那么什么是標(biāo)志語(yǔ)言,為什么叫擴(kuò)展性?已經(jīng)讓人有些糊涂。我想我們這樣來理解會(huì)好一些:

對(duì)HTML你已經(jīng)非常熟悉了吧,它就是一種標(biāo)記語(yǔ)言,記得它的全稱嗎:"Hypertext Markup Language" 超文本標(biāo)記語(yǔ)言。明白了?同時(shí),HTML里面有很多標(biāo)簽,類似,等,都是在HTML

4.0里規(guī)范和定義,而XML里允許你自己創(chuàng)建這樣的標(biāo)簽,所以叫做可擴(kuò)展性。

這里有幾個(gè)容易混淆的概念要提醒大家:

1.XML并不是標(biāo)記語(yǔ)言。它只是用來創(chuàng)造標(biāo)記語(yǔ)言(比如HTML)的元語(yǔ)言。天,又糊涂了!不要緊,你只要知道這一點(diǎn):XML和HTML是不一樣的,它的用處途比HTML廣泛得多,我們將在后面仔細(xì)介紹。

2.XML并不是HTML的替代產(chǎn)品。XML不是HTML的升級(jí),它只是HTML的補(bǔ)充,為HTML擴(kuò)展更多功能。我們?nèi)詫⒃谳^長(zhǎng)的一段時(shí)間里繼續(xù)使用HTML。(但值得注意的是HTML的升級(jí)版本XHTML的確正在向適應(yīng)XML靠攏。)

3.不能用XML來直接寫網(wǎng)頁(yè)。即便是包含了XML數(shù)據(jù),依然要轉(zhuǎn)換成HTML格式才能在瀏覽器上顯示。

下面就是一段XML示例文檔(例1),用來表示本文的信息:

<myfile>

<title>XML Quick Start</title>

<author>ajie</author>

<email>ajie@aolhoo.com</email>

<date>20010115</date>

</myfile>

注意:

1.這段代碼僅僅是代碼,讓你初步感性認(rèn)識(shí)一下XML,并不能實(shí)現(xiàn)什么具體應(yīng)用;

2.其中類似< title>,< author>的語(yǔ)句就是自己創(chuàng)建的標(biāo)記(tags),它們和HTML標(biāo)記不一樣,例如這里的< title>是文章標(biāo)題的意思,HTML里的< title>是頁(yè)面標(biāo)題。

二. XML是新概念嗎?

不是。XML來源于SGML,一種比HTML更早的標(biāo)志語(yǔ)言標(biāo)準(zhǔn)。

關(guān)于SGML,我們來簡(jiǎn)單了解一下,你只需要有個(gè)大致概念就可以。

SGML全稱是"Standard Generalized Markup Language"(通用標(biāo)識(shí)語(yǔ)言標(biāo)準(zhǔn))??疵Q就知道:它是標(biāo)志語(yǔ)言的標(biāo)準(zhǔn),也就是說所有標(biāo)志語(yǔ)言都是依照SGML制定的,當(dāng)然包括HTML。SGML的覆蓋面很廣,凡是有一定格式的文件都屬于SGML,比如報(bào)告,樂譜等等,HTML是SGML在網(wǎng)絡(luò)上最常見的文件格式。因此,人們戲稱SGML是HTML的"媽媽"。

而XML就是SGML的簡(jiǎn)化版,只不過省略了其中復(fù)雜和不常用的部分。(哦,明白了!是HTML第二個(gè)"mother",難怪比HTML功能強(qiáng)大呢。),和SGML一樣,XML也可以應(yīng)用在金融,科研等各個(gè)領(lǐng)域,我們這里講的,只是XML在web方面的運(yùn)用而已。

到這里,你應(yīng)該有點(diǎn)明白了:XML是用來創(chuàng)建定義類似HTML的標(biāo)記語(yǔ)言,然后再用這個(gè)標(biāo)記語(yǔ)言來顯示信息。 三. 使用XML有什么好處?

有了HTML,為什么還需要用XML?

因?yàn)楝F(xiàn)在網(wǎng)絡(luò)應(yīng)用越來越廣泛,僅僅靠HTML單一文件類型來處理千變?nèi)f化的文檔和數(shù)據(jù)已經(jīng)力不叢心,而且HTML本身語(yǔ)法十分不嚴(yán)密,嚴(yán)重影響網(wǎng)絡(luò)信息傳送和共享。(想想瀏覽器兼容的問題傷透多少設(shè)計(jì)師的腦細(xì)胞啊。)人們?cè)缫呀?jīng)開始探討用什么方法來滿足網(wǎng)絡(luò)上各種應(yīng)用的需要。使用SGML是可以的,但SGML太龐大,編程復(fù)雜,于是最終選擇了"減肥"的SGML---XML作為下一代web運(yùn)用的數(shù)據(jù)傳輸和交互的工具。

使用XML有什么好處?來看w3c組織(XML標(biāo)準(zhǔn)制定者)的說明:

XML使得在網(wǎng)絡(luò)上使用SGML語(yǔ)言更加"簡(jiǎn)單和直接": 簡(jiǎn)化了定義文件類型的過程,簡(jiǎn)化了編程和處理SGML文件的過程,簡(jiǎn)化了在Web上的傳送和共享。

1.XML可以廣泛的運(yùn)用于web的任何地方;

2.XML可以滿足網(wǎng)絡(luò)應(yīng)用的需求;

3.使用XML將使編程更加簡(jiǎn)單;

4.XML便于學(xué)習(xí)和創(chuàng)建;

5.XML代碼將清晰和便于閱讀理解;

還是抽象了些。讓我們?cè)诤竺娴膶?shí)例教程中慢滿體會(huì)XML的強(qiáng)大優(yōu)勢(shì)吧!

四. XML很難學(xué)嗎?

如果你有興趣學(xué)習(xí)XML,不禁會(huì)問:XML難嗎?學(xué)習(xí)XML需要什么樣的基礎(chǔ)?

XML非常簡(jiǎn)單,學(xué)習(xí)容易。如果你熟悉HTML,你會(huì)發(fā)現(xiàn)它的文檔和HTML非常相似,看同樣的示例文檔(例1):

?xml version="1.0"?>

<myfile>

<title>XML Quick Start</title>

<author>ajie</author>

<email>ajie@aolhoo.com</email>

<date>20010115</date>

</myfile>

第一行是一個(gè)XML聲明,表示文檔遵循的是XML的1.0 版的規(guī)范。

第二行定義了文檔里面的第一個(gè)元素(element),也稱為根元素: < myfile>。這個(gè)就類似HTML里的< HTML>開頭標(biāo)記。注意,這個(gè)名稱是自己隨便定義的。

再下面定義了四個(gè)子元素:title,author,email,和date。分別說明文章的標(biāo)題,作者,郵箱和日期。當(dāng)然,你可以用中文來定義這些標(biāo)簽,看上去更便于理解:

<?xml version="1.0" encoding="GB2312"?>

<文章>

<標(biāo)題>XML輕松學(xué)習(xí)手冊(cè)</標(biāo)題>

<作者>ajie</作者>

<信箱>ajie@aolhoo.com</信箱>

<日期>20010115</日期>

</文章>

這就是XML的文檔,任何掌握HTML的網(wǎng)友都可以直接寫出這樣簡(jiǎn)單的XML文檔。

另外,學(xué)習(xí)XML還必須掌握一種頁(yè)面腳本語(yǔ)言,常見的就是javascript和VB script。因?yàn)閄ML數(shù)據(jù)是使用script實(shí)現(xiàn)HTML中調(diào)用和交互的。我們看一個(gè)最簡(jiǎn)單的例子(例2):

1.將下面代碼存為myfile.htm

<html>

<head>

<script language="JavaScript" for="window" event="onload">

var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");

xmlDoc.async="false";

xmlDoc.load("myfile.xml");

nodes = xmlDoc.documentElement.childNodes;

title.innerText = nodesitem(0).text;

author.innerText = nodes.item(1).text;

email.innerText = nodes.item(2).text;

date.innerText = nodes.item(3).text;

</script>

<title>在HTML中調(diào)用XML數(shù)據(jù)</title>

</head>

<body bgcolor="#FFFFFF">

<b>標(biāo)題: </b>

<span id="title"> </span>

<b>作者: </b>>

<span id="author"></span>

<b>信箱: </b>

<span id="email"></span>

<b>日期:</b>

<span id="date"></span>

</body>

</html>

2.將下面代碼存為myfile.xml

<?xml version="1.0" encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

<email>ajie@aolhoo.com</email>

<date>20010115</date>

</myfile>

3.將它們放在同一個(gè)目錄下,用IE5以上版本瀏覽器打開,可以看到效果。 學(xué)習(xí)并掌握一種script,你將真正了解到XML無比的強(qiáng)大的功能。

五. XML和HTML的區(qū)別

XML和HTML都來自于SGML,它們都含有標(biāo)記,有著相似的語(yǔ)法,HTML和XML的最大區(qū)別在于:HTML是一個(gè)定型的標(biāo)記語(yǔ)言,它用固有的標(biāo)記來描述,顯示網(wǎng)頁(yè)內(nèi)容。比如< H1>表示首行標(biāo)題,有固定的尺寸。相對(duì)的,XML則沒有固定的標(biāo)記,XML不能描述網(wǎng)頁(yè)具體的外觀,內(nèi)容,它只是描述內(nèi)容的數(shù)據(jù)形式和結(jié)構(gòu)。

這是一個(gè)質(zhì)的區(qū)別:網(wǎng)頁(yè)將數(shù)據(jù)和顯示混在一起,而XML則將數(shù)據(jù)和顯示分開來。

我們看上面的例子,在myfile.htm中,我們只關(guān)心頁(yè)面的顯示方式,我們可以設(shè)計(jì)不同的界面,用不同的方式來排版頁(yè)面,但數(shù)據(jù)是儲(chǔ)存在myfile.xml中,不需要任何改變。

(如果你是程序員,你會(huì)驚訝的發(fā)現(xiàn),這與模塊化面向?qū)ο缶幊痰乃枷霕O其相似!其實(shí)網(wǎng)頁(yè)何嘗不是一種程序呢?)

正是這種區(qū)別使得XML在網(wǎng)絡(luò)應(yīng)用和信息共享上方便,高效,可擴(kuò)展。所以我們相信,XML做為一種先進(jìn)的數(shù)據(jù)處理方法,將使網(wǎng)絡(luò)跨越到一個(gè)新的境界。

六. XML的嚴(yán)格格式

吸取HTML松散格式帶來的經(jīng)驗(yàn)教訓(xùn),XML一開始就堅(jiān)持實(shí)行"良好的格式"。

我們先看HTML的一些語(yǔ)句,這些語(yǔ)句在HTML中隨處可見:

1.

sample

2.< b>< i>sample< /b>< /i>

3.< td>sample< /TD>

4.< font color=red>samplar< /font>

在XML文檔中,上述幾種語(yǔ)句的語(yǔ)法都是錯(cuò)誤的。因?yàn)?

1.所有的標(biāo)記都必須要有一個(gè)相應(yīng)的結(jié)束標(biāo)記;

2.所有的XML標(biāo)記都必須合理嵌套;

3.所有XML標(biāo)記都區(qū)分大小寫;

4.所有標(biāo)記的屬性必須用""括起來;

所以上列語(yǔ)句在XML中正確的寫法是

1.

sample

2.< b>< i>sample< /i>< /b>

3.< td>sample< /td>

4.< font color="red">samplar< /font>

  另外,XML標(biāo)記必須遵循下面的命名規(guī)則:

1.名字中可以包含字母、數(shù)字以及其它字母;

2.名字不能以數(shù)字或"_" (下劃線) 開頭;

3.名字不能以字母 xml (或 XML 或 Xml ..) 開頭;

4.名字中不能包含空格。

在XML文檔中任何的差錯(cuò),都會(huì)得到同一個(gè)結(jié)果:網(wǎng)頁(yè)不能被顯示。各瀏覽器開發(fā)商已經(jīng)達(dá)成協(xié)議,對(duì)XML實(shí)行嚴(yán)格而挑剔的解析,任何細(xì)小的錯(cuò)誤都會(huì)被報(bào)告。你可以將上面的myfile.xml修改一下,比如將< email>改為< Email>,然后用IE5直接打開myfile.xml,會(huì)得到一個(gè)出錯(cuò)信息頁(yè)面:

<?xml version="1.0" encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

<Email>ajie@aolhoo.com</email>

<date>20010115</date>

</myfile>

七. 關(guān)于XML的更多

好了,到現(xiàn)在你已經(jīng)知道:

1.什么是XML;

2.XML,HTML,SGML之間的關(guān)系和區(qū)別;

3.XML的簡(jiǎn)單應(yīng)用。

恭喜你!你已經(jīng)不再對(duì)XML一無所知,并且已經(jīng)走在了網(wǎng)絡(luò)技術(shù)的前沿。整個(gè)學(xué)習(xí)過程好象并不很難哦:)

如果你對(duì)XML有更多的興趣,希望進(jìn)一步了解XML的詳細(xì)資料和其它的實(shí)際運(yùn)用技術(shù),歡迎繼續(xù)瀏覽我們的下一章:XML的概念。

XML輕松學(xué)習(xí)手冊(cè)(2)XML概念

第二章 XML概念

導(dǎo)言

經(jīng)過第一章的快速入門學(xué)習(xí),你已經(jīng)知道了XML是一種能夠讓你自己創(chuàng)造標(biāo)識(shí)的語(yǔ)言,它可以將數(shù)據(jù)與格式從網(wǎng)頁(yè)中分開,它可以儲(chǔ)存數(shù)據(jù)和共享數(shù)據(jù)的特性使得XML無所不能。如果你希望深入學(xué)習(xí)XML,系統(tǒng)掌握XML的來龍去脈,那么我們首先還是要回到XML概念的問題上來。XML(Extensible Markup Language),一種擴(kuò)展性標(biāo)識(shí)語(yǔ)言。"擴(kuò)展性""標(biāo)識(shí)""語(yǔ)言"。每一個(gè)詞都明確的點(diǎn)明了XML的重要特點(diǎn)和功能。我們來仔細(xì)分析:

一. 擴(kuò)展性

二. 標(biāo)識(shí)

三. 語(yǔ)言

四. 結(jié)構(gòu)化

五. Meta數(shù)據(jù)

六. 顯示

七. DOM

一.擴(kuò)展性---使用XML,你可以為你的文檔建立自己的標(biāo)記(tags)。

XML的第一個(gè)詞是"擴(kuò)展性",這正是XML強(qiáng)大的功能和彈性的原因。

在HTML里,有許多固定的標(biāo)記,我們必須記住然后使用它們,你不能使用HTML規(guī)范里沒有的標(biāo)記。而在XML中,你能建立任何你需要的標(biāo)記。你可以充分發(fā)揮你的想象力,給你的文檔起一些好記的標(biāo)記名稱。比如,你的文檔里包含一些游戲的攻略,你可以建立一個(gè)名為<game>的標(biāo)記,然后在<game>下再根據(jù)游戲類別建立<RPG>,<SLG>等標(biāo)記。只要清晰,易于理解你可以建立任何數(shù)量的標(biāo)記。

一開始你也許會(huì)不適應(yīng),因?yàn)槲覀冊(cè)趯W(xué)習(xí)HTML時(shí),有固定的標(biāo)記可以直接學(xué)習(xí)和使用;(很多人包括我自己都是邊分析別人的代碼和標(biāo)識(shí),邊建立自己的網(wǎng)頁(yè)),而XML卻沒有任何標(biāo)記可以學(xué),也很少有文檔的標(biāo)記是一模一樣的。我們?cè)趺崔k?呵呵,沒有就自己創(chuàng)建呀。一旦你真正開始寫XML文檔,你會(huì)發(fā)現(xiàn)隨心所欲的創(chuàng)造新標(biāo)記也是一份很有趣的事。你可以建立有自己特色的標(biāo)記,甚至建立你自己的HTML語(yǔ)言。

擴(kuò)展性使你有更多的選擇和強(qiáng)大的能力,但同時(shí)也產(chǎn)生一個(gè)問題就是你必須學(xué)會(huì)規(guī)劃。你自己要理解自己的文檔,知道它由哪幾部分組成,相互之間的關(guān)系和如何識(shí)別它們。

關(guān)于建立標(biāo)識(shí)還需要說明一點(diǎn),標(biāo)識(shí)是描述數(shù)據(jù)的類型或特性,比如<width>,年齡<age>,姓名<name>等,而不是數(shù)據(jù)的內(nèi)容,比如:<10pxl>,<18>,<張三>,這些都是無用的標(biāo)記。如果你學(xué)過數(shù)據(jù)庫(kù),你可以這樣理解,標(biāo)識(shí)就是一種字段名。

二.標(biāo)識(shí)---使用XML你可以識(shí)別文檔中的元素。

XML的第二個(gè)詞是"標(biāo)識(shí)",這表明了XML的目的是標(biāo)識(shí)文檔中的元素。

不論你是HTML,還是XML,標(biāo)識(shí)的本質(zhì)在于便于理解,如果沒有標(biāo)識(shí),你的文檔在計(jì)算機(jī)看來只是一個(gè)很長(zhǎng)的字符串,每個(gè)字看起來都一樣,沒有重點(diǎn)之分。

通過標(biāo)識(shí),你的文檔才便于閱讀和理解,你可以劃分段落,列明標(biāo)題。XML中,你更可以利用其擴(kuò)展性 來為文檔建立更合適的標(biāo)識(shí)。

不過,有一點(diǎn)要提醒大家注意:標(biāo)識(shí)僅僅是用來識(shí)別信息,它本身并不傳達(dá)信息。例如這樣的HTML代碼:

<b>frist step<b>

這里<b>表示粗體,只用來說明是用粗體來顯示"frist step"字符,<b>本身并不包含任何實(shí)際的信息,在頁(yè)面上你看不到<b>,真正傳達(dá)信息的是"frist step "。

三.語(yǔ)言---使用XML你要遵循特定的語(yǔ)法來標(biāo)識(shí)你的文檔。

XML第三個(gè)詞是"語(yǔ)言"。這表明了作為一種語(yǔ)言XML必須遵循一定的規(guī)則。雖然XML的擴(kuò)展性允許你創(chuàng)建新標(biāo)識(shí),但它仍然必須遵循特定的結(jié)構(gòu),語(yǔ)法和明確的定義。

在計(jì)算機(jī)領(lǐng)域,語(yǔ)言常常表示一?quot;程序語(yǔ)言",用來編程實(shí)現(xiàn)一些功能和應(yīng)用,但不是所有的"語(yǔ)言"都是用來編程的,XML就只是一種用來定義標(biāo)識(shí)和描述信息的語(yǔ)言。

下面我們來深入了解一下XML應(yīng)用的其本原理,可能會(huì)很枯燥,但是對(duì)于整體的理解很重要,你可以先快速過一遍,心里有一個(gè)模糊的概念,具體精髓則需要在實(shí)踐中慢慢領(lǐng)會(huì)。

四.結(jié)構(gòu)化---XML促使文檔結(jié)構(gòu)化,所有的信息按某種關(guān)系排列。

"結(jié)構(gòu)化"聽起來太抽象了,我們這樣理解,結(jié)構(gòu)化就是為你的文檔建立一個(gè)框架,就象寫文章先寫一個(gè)提綱。結(jié)構(gòu)化使你的文檔看起來不會(huì)雜亂無章,每一部分都緊密聯(lián)系,形成一個(gè)整體。

結(jié)構(gòu)化有兩個(gè)原則:

1.每一部分(每一個(gè)元素)都和其他元素有關(guān)聯(lián)。關(guān)聯(lián)的級(jí)數(shù)就形成了結(jié)構(gòu)。

2.標(biāo)識(shí)本身的含義與它描述的信息相分離。

我們來看一個(gè)簡(jiǎn)單的例子幫助理解:

<?xml version="1.0" encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<chapter>XML快速入門

<para>什么是XML</para>

<para>使用XML的好處</para>

</chapter>

<chapter>XML的概念

<para>擴(kuò)展性</para>

<para>標(biāo)識(shí)</para>

</chapter>

</myfile>

這是本文的XML描述文檔,可以看到標(biāo)識(shí)分三級(jí)關(guān)聯(lián),非常清晰:

<myfile>

<chapter>

<para>

...

</para>

</chapter>

</myfile>

上面這樣的文檔結(jié)構(gòu),我們又稱之為"文檔樹",主干是父元素,如<myfile>,分支和頁(yè)是子元素,如<chapter>和<para>。

五.Meta數(shù)據(jù)(Metadata)---專業(yè)的XML使用者會(huì)使用meta數(shù)據(jù)來工作。

在HTML中我們知道可以使用meta標(biāo)識(shí)來定義網(wǎng)頁(yè)的關(guān)鍵字,簡(jiǎn)介等,這些標(biāo)識(shí)不會(huì)顯示在網(wǎng)頁(yè)中,但可以被搜索引擎搜索到,并影響搜索結(jié)果的排列順序。

XML對(duì)這一原理進(jìn)行了深化和擴(kuò)展,用XML,你可以描述你的信息在哪里,你可以通過meta來驗(yàn)證信息,執(zhí)行搜索,強(qiáng)制顯示,或者處理其他的數(shù)據(jù)。

下面是一些XML metadata在實(shí)際應(yīng)用中的用途:

1.可以驗(yàn)證數(shù)字簽名,使在線商務(wù)的提交動(dòng)作(submission)有效。

2.可以被方便的建立索引和進(jìn)行更有效搜索。

3.可以在不同語(yǔ)言之間傳輸數(shù)據(jù)。

W3C組織正在研究一種名為RDF(Resource Description Framework)的metadata處理方法,可以自動(dòng)交換信息,W3C宣稱,使用RDF配合數(shù)字簽名,將使網(wǎng)絡(luò)中存在"真實(shí)可信"的電子商務(wù)。

六.顯示

單獨(dú)用XMl不能顯示頁(yè)面,我們使用格式化技術(shù),比如CSS或者XSL,才能顯示XML標(biāo)記創(chuàng)建的文檔。

我們?cè)谇懊娴谝徽轮v到XML是將數(shù)據(jù)和格式分離的。XML文檔本身不知道如何來顯示,必須有輔助文件來幫助實(shí)現(xiàn)。(XML取消了所有標(biāo)識(shí),包括font,color,p等風(fēng)格樣式定義標(biāo)識(shí),因此XML全部是采用類似DHTML中CSS的方法來定義文檔風(fēng)格樣式。),XML中用來設(shè)定顯示風(fēng)格樣式的文件類型有:

1.XSL

XSL全稱是Extensible Stylesheet Language(可擴(kuò)展樣式語(yǔ)言), 是將來設(shè)計(jì)XML文檔顯示樣式的主要文件類型。它本身也是基于XML語(yǔ)言的。使用XSL,你可以靈活的設(shè)置文檔顯示樣式,文檔將自動(dòng)適應(yīng)任何瀏覽器和PDA(掌上電腦)。

XSL也可以將XML轉(zhuǎn)化為HTML,那樣,老的瀏覽器也可以瀏覽XML文檔了。

2.CSS

CSS大家很熟悉了,全稱是Cascading Style Sheets(層疊樣式表),是目前用來在瀏覽器上顯示XML文檔的主要方法。

3.Behaviors

Behaviors現(xiàn)在還沒有成為標(biāo)準(zhǔn)。它是微軟的IE瀏覽器特有的功能,用它可以對(duì)XML標(biāo)識(shí)設(shè)定一些有趣動(dòng)作。

七.DOM

DOM全稱是document object model(文檔對(duì)象模型),DOM是用來干什么的呢?假設(shè)把你的文檔看成一個(gè)單獨(dú)的對(duì)象,DOM就是如何用HTML或者XML對(duì)這個(gè)對(duì)象進(jìn)行操作和控制的標(biāo)準(zhǔn)。

面向?qū)ο蟮乃枷敕椒ㄒ呀?jīng)非常流行了,在編程語(yǔ)言(例如java,js)中,都運(yùn)用面向?qū)ο蟮木幊趟枷?。在XML中,就是要將網(wǎng)頁(yè)也作為一個(gè)對(duì)象來操作和控制,我們可以建立自己的對(duì)象和模板。與對(duì)象進(jìn)行交流,如何命令對(duì)象,就要用到API。API全稱Application Programming Interface,它是訪問和操作對(duì)象的規(guī)則。而DOM就是一種詳細(xì)描述HTML/XML文檔對(duì)象規(guī)則的API。它規(guī)定了HTML/XML文檔對(duì)象的命名協(xié)定,程序模型,溝通規(guī)則等。在XML文檔中,我們可以將每一個(gè)標(biāo)識(shí)元素看作一個(gè)對(duì)象---它有自己的名稱和屬性。

XML創(chuàng)建了標(biāo)識(shí),而DOM的作用就是告訴script如何在瀏覽器窗口中操作和顯示這些標(biāo)識(shí)

上面我們已經(jīng)簡(jiǎn)要的講述了一些XML的基本原理,我們來看看它們之間的關(guān)聯(lián)以及它們是如何工作的,先看這里一張圖:

此主題相關(guān)圖片如下:

1.XML描述數(shù)據(jù)類型。例如:"King lear"是一個(gè)標(biāo)題元素;

2.CSS儲(chǔ)存并控制元素的顯示樣式。例如:標(biāo)題將被以18pt字體顯示

3.script腳本控制元素如何動(dòng)作。例如:當(dāng)一個(gè)title元素"out of stock",將被用紅色顯示。

4.DOM則為腳本和對(duì)象的交流提供一個(gè)公共平臺(tái),并將結(jié)果顯示在瀏覽器窗口。

如果任何一個(gè)部分發(fā)生錯(cuò)誤,都不會(huì)得到正確結(jié)果。

好了,看到這里,我們已經(jīng)對(duì)XML是如何工作的有一個(gè)整體的大致的概念。通過這一章的學(xué)習(xí),我們可能感覺到XML似乎更偏向數(shù)據(jù)處理,更方便程序員學(xué)習(xí)。實(shí)際情況也是這樣的,XML設(shè)計(jì)的目的就是用來方便的共享和交互數(shù)據(jù)的。下一章,我們將系統(tǒng)的了解關(guān)于XML的各種術(shù)語(yǔ)。歡迎您繼續(xù)瀏覽。

XML輕松學(xué)習(xí)手冊(cè)(3)XML的術(shù)語(yǔ)

第三章 XML的術(shù)語(yǔ)

提綱:

導(dǎo)言

一.XML文檔的有關(guān)術(shù)語(yǔ)

二.DTD的有關(guān)術(shù)語(yǔ)

導(dǎo)言

初學(xué)XML最令人頭疼的就是有一大堆新的術(shù)語(yǔ)概念要理解。由于XML本身也是一個(gè)嶄新的技術(shù),正在不斷發(fā)展和變化,各組織和各大網(wǎng)絡(luò)公司(微軟,IBM,SUN等)都在不斷推出自己的見解和標(biāo)準(zhǔn),因此新概念漫天飛就不足為奇了。而國(guó)內(nèi)又缺乏權(quán)威的機(jī)構(gòu)或組織來對(duì)這些術(shù)語(yǔ)正式定名,你所看見的有關(guān)XML的中文教材大部分是靠作者本身的理解翻譯過來的,有些是正確的,有些是錯(cuò)誤的,更加妨礙了我們對(duì)這些概念的理解和學(xué)習(xí)。

你下面將要看到的關(guān)于XML術(shù)語(yǔ)的解釋,也是作者本身的理解和翻譯。阿捷是以W3C組織發(fā)布的XML1.0標(biāo)準(zhǔn)規(guī)范和相關(guān)的正式說明文檔為根據(jù)來講述。可以確保這些理解是基本正確的,至少不是錯(cuò)誤的。你如果想進(jìn)一步閱讀和了解,我在本文的最后部分列明了相關(guān)資源的出處和鏈接,你可以直接訪問。好,我們轉(zhuǎn)入正題:

一.XML文檔的有關(guān)術(shù)語(yǔ)

什么是XML文檔?知道HTML原代碼文件吧,XML文檔就是用XML標(biāo)識(shí)寫的XML原代碼文件。XML文檔也是ASCII的純文本文件,你可以用Notepad創(chuàng)建和修改。XML文檔的后綴名為.XML,例如myfile.xml。用IE5.0以上瀏覽器也可以直接打開.xml文件,但你看到的就是"XML原代碼",而不會(huì)顯示頁(yè)面內(nèi)容。你可以將下面代碼存為myfile.xml試試:

<?xml version="1.0" encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

<email>ajie@aolhoo.com</email>

<date>20010115</date>

</myfile>

XML文檔包含三個(gè)部分:

1. 一個(gè)XML文檔聲明;

2. 一個(gè)關(guān)于文檔類型的定義;

3. 用XML標(biāo)識(shí)創(chuàng)建的內(nèi)容。

舉例說明:

<?xml version="1.0"?>

<!DOCTYPE filelist SYSTEM "filelist.dtd">

<filelist>

<myfile>

<title>QUICK START OF XML</title>

<author>ajie</author>

</myfile>

......

</filelist>

其中第一行<?xml version="1.0"?>就是一個(gè)XML文檔的聲明,第二行說明這個(gè)文檔是用filelist.dtd來定義文檔類型的,第三行以下就是內(nèi)容主體部分。

我們來了解XML文檔中有關(guān)的術(shù)語(yǔ):

1.Element(元素):

元素在HTML我們已經(jīng)有所了解,它是組成HTML文檔的最小單位,在XML中也一樣。一個(gè)元素由一個(gè)標(biāo)識(shí)來定義,包括開始和結(jié)束標(biāo)識(shí)以及其中的內(nèi)容,就象這樣:<author>ajie</author>

唯一不同的就是:在HTML中,標(biāo)識(shí)是固定的,而在XML中,標(biāo)識(shí)需要你自己創(chuàng)建。

2.Tag(標(biāo)識(shí))

標(biāo)識(shí)是用來定義元素的。在XML中,標(biāo)識(shí)必須成對(duì)出現(xiàn),將數(shù)據(jù)包圍在中間。標(biāo)識(shí)的名稱和元素的名稱是一樣的。例如這樣一個(gè)元素:

<author>ajie</author>

其中<author>就是標(biāo)識(shí)。

3.Attribute(屬性):

什么是屬性?看這段HTML代碼:<font color="red">word</font>。其中color就是font的屬性之一。

屬性是對(duì)標(biāo)識(shí)進(jìn)一步的描述和說明,一個(gè)標(biāo)識(shí)可以有多個(gè)屬性,例如font的屬性還有size。XML中的屬性與HTML中的屬性是一樣的,每個(gè)屬性都有它自己的名字和數(shù)值,屬性是標(biāo)識(shí)的一部分。舉例:

<author sex="female">ajie</author>

XML中屬性也是自己定義的,我們建議你盡量不使用屬性,而將屬性改成子元素,例如上面的代碼可以改成這樣:

<author>ajie

<sex>female</sex>

</author>

原因是屬性不易擴(kuò)充和被程序操作。

4.Declaration(聲明)

在所有XML文檔的第一行都有一個(gè)XML聲明。這個(gè)聲明表示這個(gè)文檔是一個(gè)XML文檔,它遵循的是哪個(gè)XML版本的規(guī)范。一個(gè)XML的聲明語(yǔ)句就象這樣:

<?xml version="1.0"?>

5.DTD(文件類型定義)

DTD是用來定義XML文檔中元素,屬性以及元素之間關(guān)系的。

通過DTD文件可以檢測(cè)XML文檔的結(jié)構(gòu)是否正確。但建立XML文檔并不一定需要DTD文件。關(guān)于DTD文件的詳細(xì)說明我們將在下面單獨(dú)列項(xiàng)。

6.Well-formed XML(良好格式的XML)

一個(gè)遵守XML語(yǔ)法規(guī)則,并遵守XML規(guī)范的文檔稱之為"良好格式"。如果你所有的標(biāo)識(shí)都嚴(yán)格遵守XML規(guī)范,那么你的XML文檔就不一定需要DTD文件來定義它。

良好格式的文檔必須以一個(gè)XML聲明開始,例如:

<?xml version="1.0" standalone="yes" encoding="UTF-8"?>

其中你必須說明文檔遵守的XML版本,目前是1.0;其次說明文檔是"獨(dú)立的",它不需要DTD文件來驗(yàn)證其中的標(biāo)識(shí)是否有效;第三,要說明文檔所使用的語(yǔ)言編碼。默認(rèn)的是UTF-8,如果使用中文,你需要設(shè)置為GB2312。

良好格式的XML文檔必須有一個(gè)根元素,就是緊接著聲明后面建立的第一個(gè)元素,其它元素都是這個(gè)根元素的子元素,屬于根元素一組。

良好格式的XML文檔的內(nèi)容書寫時(shí)必須遵守XML語(yǔ)法。(有關(guān)XML語(yǔ)法我們將在下一章仔細(xì)講解)

7.Valid XML(有效的XML)

一個(gè)遵守XML語(yǔ)法規(guī)則,并遵守相應(yīng)DTD文件規(guī)范的XML文檔稱為有效的XML文檔。注意我們比較"Well-formed XML"和"Valid

XML",它們最大的差別在于一個(gè)完全遵守XML規(guī)范,一個(gè)則有自己的"文件類型定義(DTD)"。

將XML文檔和它的DTD文件進(jìn)行比較分析,看是否符合DTD規(guī)則的過程叫validation(確認(rèn))。這樣的過程通常我們是通過一個(gè)名為parser的軟件來處理的。

有效的XML文檔也必須以一個(gè)XML聲明開始,例如:

<?xml version="1.0" standalone="no" encode="UTF-8"?>

和上面例子不同的,在standalone(獨(dú)立)屬性中,這里設(shè)置的是"no",因?yàn)樗仨毢拖鄳?yīng)的DTD一起使用,DTD文件的定義方法如下:

<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">

其中:

"!DOCTYPE"是指你要定義一個(gè)DOCTYPE;

"type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同;

"SYSTEM/PUBLIC"這兩個(gè)參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網(wǎng)址,而PUBLIC則指文檔調(diào)用一個(gè)公用的DTD文件的網(wǎng)址。

"dtd-name" 就是DTD文件的網(wǎng)址和名稱。所有DTD文件的后綴名為".dtd"。

我們還是用上面的例子,應(yīng)該寫成這樣:

<?xml version="1.0" standalone="no" encode="UTF-8"?>

<!DOCTYPE filelist SYSTEM "filelist.dtd">

二.DTD的有關(guān)術(shù)語(yǔ)

什么是DTD,我們上面已經(jīng)簡(jiǎn)略提到。DTD是一種保證XML文檔格式正確的有效方法,可以比較XML文檔和DTD文件來看文檔是否符合規(guī)范,元素和標(biāo)簽使用是否正確。一個(gè)DTD文檔包含:元素的定義規(guī)則,元素間關(guān)系的定義規(guī)則,元素可使用的屬性,可使用的實(shí)體或符號(hào)規(guī)則。

DTD文件也是一個(gè)ASCII的文本文件,后綴名為.dtd。例如:myfile.dtd。

為什么要用DTD文件呢?我的理解是它滿足了網(wǎng)絡(luò)共享和數(shù)據(jù)交互,使用DTD最大的好處在于DTD文件的共享。(就是上文DTD說明語(yǔ)句中的PUBLIC屬性)。比如,兩個(gè)相同行業(yè)不同地區(qū)的人使用同一個(gè)DTD文件來作為文檔創(chuàng)建規(guī)范,那么他們的數(shù)據(jù)就很容易交換和共享。網(wǎng)上有其他人想補(bǔ)充數(shù)據(jù),也只需要根據(jù)公用的DTD規(guī)范來建立文檔,就立刻可以加入。

目前,已經(jīng)有數(shù)量眾多的寫好的DTD文件可以利用。針對(duì)不同的行業(yè)和應(yīng)用,這些DTD文件已經(jīng)建立了通用的元素和標(biāo)簽規(guī)則。你不需要自己重新創(chuàng)建,只要在他們的基礎(chǔ)上加入你需要的新標(biāo)識(shí)。

當(dāng)然,如果愿意,你可以創(chuàng)建自己的DTD,它可能和你的文檔配合的更加完美。建立自己的DTD也是很簡(jiǎn)單的一件事,一般只需要定義4-5個(gè)元素就可以了。

調(diào)用DTD文件的方法有兩種:

1.直接包含在XML文檔內(nèi)的DTD

你只要在DOCTYPE聲明中插入一些特別的說明就可以了,象這樣:

我們有一個(gè)XML文檔:

<?xml version="1.0" encoding="GB2312"?>

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

</myfile>

我們?cè)诘谝恍泻竺娌迦胂旅娲a就可以:

<!DOCTYPE myfile [

<!ELEMENT title (#PCDATA)>

<!ELEMENT author (#PCDATA)>

<!ENTITY copyright "Copyright 2001, Ajie.">

]>

2.調(diào)用獨(dú)立的DTD文件

將DTD文檔存為.dtd的文件,然后在DOCTYPE聲明行中調(diào)用,例如,將下面的代碼存為myfile.dtd

<!ELEMENT myfile (title, author)>

<!ELEMENT title (#PCDATA)>

<!ELEMENT author (#PCDATA)>

然后在XML文檔中調(diào)用,在第一行后插入:

<!DOCTYPE myfile SYSTEM "myfile.dtd">

我們可以看到DTD文檔和HTML中js的調(diào)用是差不多的,關(guān)于DTD文檔具體如何寫,我們將在下一章和XML文檔的語(yǔ)法一起介紹。

下面我們來了解DTD有關(guān)的術(shù)語(yǔ):

1.Schema(規(guī)劃)

schema是數(shù)據(jù)規(guī)則的描述。schema做兩件事:

a.它定義元素?cái)?shù)據(jù)類型和元素之間的關(guān)系;

b.它定義元素所能包含的內(nèi)容類型。

DTD就是關(guān)于XML文檔的一個(gè)schema。

2.Document Tree(文檔樹)

"文檔樹"在前面第二章我們已經(jīng)提到過,它是文檔元素分級(jí)結(jié)構(gòu)的形象表示。一個(gè)文檔結(jié)構(gòu)樹包含根元素,根元素是最頂級(jí)的元素,(就是緊接著XML聲明語(yǔ)句后的第一個(gè)元素)??蠢樱?

<?xml version="1.0"?>

<filelist>

<myfile>

<title>...</title>

<author>...</author>

</myfile>

</filelist>

上面的例子分三級(jí)結(jié)構(gòu)排列成"樹"狀,其中的<filelist>就是根元素。在XML和DTD文件中,第一個(gè)定義的都是根元素。

3.Parent Element(父元素)/Child Element(子元素)

父元素是指包含有其它元素的元素,被包含的元素稱為它的子元素??瓷厦娴?結(jié)構(gòu)樹",其中<myfile>是父元素,<title>,<author>是它的子元素,而<myfile>又是<filelist>的子元素。象<title>這樣沒有包含任何子元素的最后一級(jí)元素我們也稱之為"頁(yè)元素"。

4.Parser(解析軟件)

Parser是一種檢查XML文檔是否遵循DTD規(guī)范的工具軟件。

XML的parser發(fā)展為兩類:一種是"非確認(rèn)類paeser",只檢測(cè)文檔是否遵守XML語(yǔ)法規(guī)則,是否用元素標(biāo)識(shí)建立了文檔樹。另一種是"確認(rèn)類paeser",它不但檢測(cè)文檔語(yǔ)法,結(jié)構(gòu)樹,而且比較解析你使用的元素標(biāo)識(shí)是否遵守了相應(yīng)DTD文件的規(guī)范。

Parser能獨(dú)立使用,也可以成為編輯軟件或?yàn)g覽器的一部分。在后面的相關(guān)資源列表里,我列出了當(dāng)前比較流行的一些parsers。

  好了,通過第三章的學(xué)習(xí),我們已經(jīng)了解了一些XML和DTD的基本術(shù)語(yǔ),但是我們還不知道怎樣來寫這些文件,需要遵循什么樣的語(yǔ)法,在下一章,將重點(diǎn)介紹有關(guān)撰寫XML和DTD文檔的語(yǔ)法。請(qǐng)繼續(xù)瀏覽,謝謝!

XML輕松學(xué)習(xí)手冊(cè)(4)XML語(yǔ)法

第四章 XML語(yǔ)法

提綱:

一.XML語(yǔ)法規(guī)則

二.元素的語(yǔ)法

三.注釋的語(yǔ)法

四.CDATA的語(yǔ)法

五.Namespaces的語(yǔ)法

六.entity的語(yǔ)法

七.DTD的語(yǔ)法

通過前面三章的學(xué)習(xí),我們已經(jīng)對(duì)什么是XML,它的實(shí)現(xiàn)原理以及相關(guān)的術(shù)語(yǔ)有所了解。接下來我們就開始學(xué)習(xí)XML的語(yǔ)法規(guī)范,動(dòng)手寫自己的XML文檔。

一.XML語(yǔ)法規(guī)則

XML的文檔和HTML的原代碼類似,也是用標(biāo)識(shí)來標(biāo)識(shí)內(nèi)容。創(chuàng)建XML文檔必須遵守下列重要規(guī)則:

規(guī)則1:必須有XML聲明語(yǔ)句

這一點(diǎn)我們?cè)谏弦徽聦W(xué)習(xí)時(shí)已經(jīng)提到過。聲明是XML文檔的第一句,其格式如下:

<?xml version="1.0" standalone="yes/no" encoding="UTF-8"?>

聲明的作用是告訴瀏覽器或者其它處理程序:這個(gè)文檔是XML文檔。聲明語(yǔ)句中的version表示文檔遵守的XML規(guī)范的版本;standalone表示文檔是否附帶DTD文件,如果有,參數(shù)為no;encoding表示文檔所用的語(yǔ)言編碼,默認(rèn)是UTF-8。

規(guī)則2:是否有DTD文件

如果文檔是一個(gè)"有效的XML文檔"(見上一章),那么文檔一定要有相應(yīng)DTD文件,并且嚴(yán)格遵守DTD文件制定的規(guī)范。DTD文件的聲明語(yǔ)句緊跟在XML聲明語(yǔ)句后面,格式如下:

<!DOCTYPE type-of-doc SYSTEM/PUBLIC "dtd-name">

其中:

"!DOCTYPE"是指你要定義一個(gè)DOCTYPE;

"type-of-doc"是文檔類型的名稱,由你自己定義,通常于DTD文件名相同;

"SYSTEM/PUBLIC"這兩個(gè)參數(shù)只用其一。SYSTEM是指文檔使用的私有DTD文件的網(wǎng)址,而PUBLIC則指文檔調(diào)用一個(gè)公用的DTD文件的網(wǎng)址。

"dtd-name" 就是DTD文件的網(wǎng)址和名稱。所有DTD文件的后綴名為".dtd"。

我們還是用上面的例子,應(yīng)該寫成這樣:

<?xml version="1.0" standalone="no" encode="UTF-8"?>

<!DOCTYPE filelist SYSTEM "filelist.dtd">

規(guī)則3:注意你的大小寫

在XML文檔中,大小寫是有區(qū)別的。<P>和<p>是不同的標(biāo)識(shí)。注意在寫元素時(shí),前后標(biāo)識(shí)大小寫要保持一樣。例如:<Author>ajie</Author>,寫成<Author>ajie</author>是錯(cuò)誤的。

你最好養(yǎng)成一種習(xí)慣,或者全部大寫,或者全部小寫,或者大寫第一個(gè)字母。這樣可以減少因?yàn)榇笮懖黄ヅ洚a(chǎn)生的文檔錯(cuò)誤。

規(guī)則4:給屬性值加引號(hào)

在HTML代碼里面,屬性值可以加引號(hào),也可以不加。例如:<font color=red>word</font>和<font color="red">word</font>都可以被瀏覽器正確解釋。

但是在XML中則規(guī)定,所有屬性值必須加引號(hào)(可以是單引號(hào),也可以是雙引號(hào)),否則將被視為錯(cuò)誤。

規(guī)則5:所有的標(biāo)識(shí)必須有相應(yīng)的結(jié)束標(biāo)識(shí)

在HTML中,標(biāo)識(shí)可能不是成對(duì)出現(xiàn)的,比?lt;br>。而在XML中規(guī)定,所有標(biāo)識(shí)必須成對(duì)出現(xiàn),有一個(gè)開始標(biāo)識(shí),就必須有一個(gè)結(jié)束標(biāo)識(shí)。否則將被視為錯(cuò)誤。

規(guī)則6:所有的空標(biāo)識(shí)也必須被關(guān)閉

空標(biāo)識(shí)就是標(biāo)識(shí)對(duì)之間沒有內(nèi)容的標(biāo)識(shí)。比如

,<img>等標(biāo)識(shí)。在XML中,規(guī)定所有的標(biāo)識(shí)必須有結(jié)束標(biāo)識(shí),針對(duì)這樣的空標(biāo)識(shí),XML中處理的方法是在原標(biāo)識(shí)最后加/,就可以了。例如:

應(yīng)寫為<br />;

<META name="keywords" content="XML, SGML, HTML">應(yīng)寫為<META name="keywords" content="XML, SGML, HTML" />;

<IMG src= "cool.gif">應(yīng)寫為<IMG src= "cool.gif" />

第四章 XML語(yǔ)法

二.元素的語(yǔ)法

元素由一對(duì)標(biāo)識(shí)以及其中的內(nèi)容組成。就象這樣:ajie。元素的名稱和標(biāo)識(shí)的名稱是一樣的。標(biāo)識(shí)可以用屬性來進(jìn)一步描述。

在XML中,沒有任何保留字,所以你可以隨心所欲的用任何詞語(yǔ)來作為元素名稱。但是也必須遵守下列規(guī)范:

1.名稱中可以包含字母、數(shù)字以及其它字母;

2.名稱不能以數(shù)字或"_" (下劃線)開頭;

3.名稱不能以字母 xml(或 XML 或 Xml ..)開頭

4.名稱中不能包含空格

5.名稱中間不能包含":"(冒號(hào))

為了使元素更容易閱讀理解和操作,我們還有一些建議:

1.名稱中不要使用"."。因?yàn)樵诤芏喑绦蛘Z(yǔ)言中,"."是作為對(duì)象的屬性,例如:font.color。同樣的原因"-"也最好不要用,必須使用的,以"_"代替;

2.名稱盡量簡(jiǎn)短。

3.名稱的大小寫盡量采用同一標(biāo)準(zhǔn)。

4.名稱可以使用非英文字符,比如用中文。但是有些軟件可能不支持。(IE5目前是支持中文元素的。)

另外,補(bǔ)充一點(diǎn)關(guān)于屬性的說明。在HTML中,屬性可以用來定義元素的顯示格式,比如:<font color="red">word</font>將把word顯示為紅色。而在XML中,屬性只是對(duì)標(biāo)識(shí)的描述,與元素內(nèi)容的顯示無關(guān)。例如同樣一句:<font color="red">word</font>,并不會(huì)將word顯示為紅色。(那么,有網(wǎng)友會(huì)問:如何在XML中將文字顯示為紅色呢?這就需要使用CSS或者XSL,我們?cè)谙旅嬖敿?xì)講述。)

三.注釋的語(yǔ)法

注釋是為了便于閱讀和理解,在XML文檔添加的附加信息,將不會(huì)被程序解釋或則瀏覽器顯示。

注釋的語(yǔ)法如下:

<!-- 這里是注釋信息 -->

可以看到,它和HTML中的注釋語(yǔ)法是一樣的,非常容易。養(yǎng)成良好的注釋習(xí)慣將使你的文檔更加便于維護(hù),共享,看起來也更專業(yè)。

四.CDATA的語(yǔ)法

CDATA全稱character data,翻譯為字符數(shù)據(jù)。我們?cè)趯慩ML文檔時(shí),有時(shí)需要顯示字母,數(shù)字和其它的符號(hào)本身,比如"<",而在XML中,這些字符已經(jīng)有特殊的含義,我們?cè)趺崔k呢?這就需要用到CDATA語(yǔ)法。語(yǔ)法格式如下:

<![CDATA[這里放置需要顯示的字符]]>

例如:

<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>

在頁(yè)面上顯示的內(nèi)容將是"<AUTHOR sex="female">ajie</AUTHOR>"

第四章 XML語(yǔ)法

五.Namespaces的語(yǔ)法

Namespaces翻譯為名字空間。名字空間有什么作用呢?當(dāng)我們?cè)谝粋€(gè)XML文檔中使用他人的或者多個(gè)DTD文件,就會(huì)出現(xiàn)這樣的矛盾:因?yàn)閄ML中標(biāo)識(shí)都是自己創(chuàng)建的,在不同的DTD文件中,標(biāo)識(shí)名可能相同但表示的含義不同,這就可能引起數(shù)據(jù)混亂。

比如在一個(gè)文檔<table>wood table</table>中<table>表示桌子,

而在另一個(gè)文檔<table>namelist</table>中<table>表示表格。如果我需要同時(shí)處理這兩個(gè)文檔,就會(huì)發(fā)生名字沖突。

了解決這個(gè)問題,我們引進(jìn)了namespaces這個(gè)概念。namespaces通過給標(biāo)識(shí)名稱加一個(gè)網(wǎng)址(URL)定位的方法來區(qū)別這些名稱相同的標(biāo)識(shí)。

Namespaces同樣需要在XML文檔的開頭部分聲明,聲明的語(yǔ)法如下:

<document xmlns:yourname='URL'>

其中yourname是由你定義的namespaces的名稱,URL就是名字空間的網(wǎng)址。

假設(shè)上面的"桌子<table>"文檔來自http://www.zhuozi.com,我們就可以聲明為

<document xmlns:zhuozi='http://www.zhuozi.com'>

然后在后面的標(biāo)識(shí)中使用定義好的名字空間:

<zhuozi:table>wood table</table>

這樣就將這兩個(gè)<table>區(qū)分開來。注意的是:設(shè)置URL并不是說這個(gè)標(biāo)識(shí)真的要到那個(gè)網(wǎng)址去讀取,僅僅作為一種區(qū)別的標(biāo)志而已。

六.entity的語(yǔ)法

entity翻譯為"實(shí)體"。它的作用類似word中的"宏",也可以理解為DW中的摸板,你可以預(yù)先定義一個(gè)entity,然后在一個(gè)文檔中多次調(diào)用,或者在多個(gè)文檔中調(diào)用同一個(gè)entity。

entity可以包含字符,文字等等,使用entity的好處在于:1.它可以減少差錯(cuò),文檔中多個(gè)相同的部分只需要輸入一遍就可以了。2.它提高維護(hù)效率。比如你有40個(gè)文檔都包含copyright的entity,如果需要修改這個(gè)copyright,不需要所有的文件都修改,只要改最初定義的entity語(yǔ)句就可以了。

XML定義了兩種類型的entity。一種是我們這里說的普通entity,在XML文檔中使用;另一種是參數(shù)entity,在DTD文件中使用。

entity的定義語(yǔ)法為:

<!DOCTYPE filename [

<!ENTITY entity-name "entity-content"

]

>

例如我要定義一段版權(quán)信息:

<!DOCTYPE copyright [

<!ENTITY copyright "Copyright 2001, Ajie. All rights reserved"

]

>

如果我的版權(quán)信息內(nèi)容和他人共享一個(gè)XML文件,也可以使用外部調(diào)用的方法,語(yǔ)法象這樣:

<!DOCTYPE copyright [

<!ENTITY copyright SYSTEM "http://www.sample.com/copyright.xml">

]

>

定義好的entity在文檔中的引用語(yǔ)法為:&entity-name;

例如,上面定義的版權(quán)信息,調(diào)用時(shí)寫作?copyright;

完整的例子如下,你可以copy下來存為copyright.xml觀看實(shí)例:

<?xml version="1.0" encoding="GB2312"?>

<!DOCTYPE copyright [

<!ENTITY copyright "Copyright 2001, Ajie. All rights reserved">

]>

<myfile>

<title>XML</title>

<author>ajie</author>

<email>ajie@aolhoo.com</email>

<date>20010115</date>

©right;

</myfile>

第四章 XML語(yǔ)法

七.DTD的語(yǔ)法

DTD是"有效XML文檔"的必須文件,我們通過DTD文件來定義文檔中元素和標(biāo)識(shí)的規(guī)則及相互關(guān)系。如何建立一個(gè)DTD文件呢?讓我們一起來學(xué)習(xí):

1.設(shè)置元素

元素是XML文檔的基本組成部分。你要在DTD中定義一個(gè)元素,然后在XML文檔中使用。元素的定義語(yǔ)法為:<!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>

說明:

"<!ELEMENT" 是元素的聲明,說明你要定義的是一個(gè)元素;

聲明后面的"DESCRIPTION",是元素的名稱;

"(#PCDATA, DEFINITION)*>"則是該元素的使用規(guī)則。規(guī)則定義了元素可以包含的內(nèi)容以及相互的關(guān)系。下面的表格概要列出了元素的規(guī)則:

2.元素規(guī)則表:

此主題相關(guān)圖片如下:

另外,我們還可以為元素定義屬性,因?yàn)槲覀儾煌扑]使用屬性,在這里就不詳細(xì)展開了。

 最后,我們來總結(jié)一些前四章學(xué)習(xí)的內(nèi)容,寫一個(gè)包含DTD,XML,以及Script的簡(jiǎn)單實(shí)例,便于讀者理解:

1.將下面文件存為myfile.dtd

<!ELEMENT myfile (title, author)>

<!ELEMENT title (#PCDATA)>

<!ELEMENT author (#PCDATA)>

2.然后建立XML文檔myfile.xml:

<?xml version="1.0" encoding="GB2312"?>

<!DOCTYPE myfile SYSTEM "myfile.dtd">

<myfile>

<title>XML輕松學(xué)習(xí)手冊(cè)</title>

<author>ajie</author>

</myfile>

3.建立HTML文檔myfile.html

<html>

<head>

<script language="JavaScript" for="window" event="onload">

var xmlDoc = new ActiveXObject("Microsoft.XMLDOM");

xmlDoc.async="false";

xmlDoc.load("myfile.xml");

nodes = xmlDoc.documentElement.childNodes;

title.innerText = nodes.item(0).text;

author.innerText = nodes.item(1).text;

</script>

<title>在HTML中調(diào)用XML數(shù)據(jù)</title>

</head>

<body bgcolor="#FFFFFF">

<b>標(biāo)題: </b>

<span id="title"></span><br>

<b>作者: </b>

<span id="author"></span><br>

</body>

</html>

4.用IE5.0以上瀏覽器打開myfile.html就可以看到效果了。

XML輕松學(xué)習(xí)手冊(cè)(5)XML實(shí)例解析

第五章:XML實(shí)例解析

提綱:

一:實(shí)例效果

二:實(shí)例解析

  1.定義新標(biāo)識(shí)。

  2.建立XML文檔。

  3.建立相應(yīng)的HTML文件。

XML在不同領(lǐng)域有著廣泛的應(yīng)用,比如在科技領(lǐng)域的MathML,無線通信應(yīng)用的WML,在網(wǎng)絡(luò)圖象方面的SVG等等,我們這里側(cè)重討論XML在web上的應(yīng)用。XML在web上應(yīng)用主要是利用其強(qiáng)大的數(shù)據(jù)操作能力。一般用XML配合javascript和asp等服務(wù)器端程序,可以實(shí)現(xiàn)網(wǎng)絡(luò)上幾乎所有的應(yīng)用需求。

考慮講解方便,我們?cè)谙旅娼榻B一個(gè)簡(jiǎn)單的實(shí)例,不包含服務(wù)器端程序。目的在于讓您對(duì)XML的數(shù)據(jù)操作能力有一個(gè)感性的認(rèn)識(shí)。

好,我們首先[ 點(diǎn)擊這里 ]來看實(shí)例的效果。(請(qǐng)用IE5.0以上版本瀏覽器打開)

這是一個(gè)簡(jiǎn)單的CD唱片數(shù)據(jù)檢索功能。你通過點(diǎn)擊"上一張","下一張"可以看到單張CD的有關(guān)信息。這樣的效果我們?cè)瓉碛脙煞N方法可以實(shí)現(xiàn):

1.利用DHTML,將數(shù)據(jù)隱藏在不同的層中,通過鼠標(biāo)事件依次顯示;

2.利用后臺(tái)程序(如ASP,CGI,PHP,JSP等),調(diào)用服務(wù)器端的數(shù)據(jù)。

但是在這個(gè)實(shí)例中,我們打開頁(yè)面原代碼可以看到,其中沒有用DHTML的DIV,也沒有表單的action,它完全是用XML來實(shí)現(xiàn)的。下面我們來分析它的制作過程:

第一步:定義新標(biāo)識(shí)。

根據(jù)實(shí)際的CD數(shù)據(jù),首先新建一個(gè)名為<CD>的標(biāo)識(shí);其次建立它相關(guān)的數(shù)據(jù)標(biāo)識(shí),分別是:CD名稱<Title>,演唱者<Artist>,出版年代<Year>,國(guó)家<Country>,發(fā)行公司<Company>和價(jià)格<Price>;最后還要建立一個(gè)名為目錄<CATALOG>的標(biāo)識(shí)。為什么要再建立一個(gè)<CATALOG>標(biāo)識(shí)呢?因?yàn)樵赬ML文檔中規(guī)定,必須且只能有一個(gè)根元素(標(biāo)識(shí)),我們有多個(gè)CD數(shù)據(jù),這些數(shù)據(jù)是并列的關(guān)系,所以需要為這些并列的元素建立一個(gè)根元素。

以上元素的定義和關(guān)系都完全符合XML標(biāo)準(zhǔn),不需要特別的DTD文件來定義,所以可以省略DTD定義。如果我們想使用DTD來定義,以上過程可以表示為:

<!ELEMENT CATALOG (CD)*>

<!ELEMENT CD (Title,Artist,Year,Country,Company,Price)>

<!ELEMENT Title (#PCDATA)>

<!ELEMENT Artist (#PCDATA)>

<!ELEMENT Year (#PCDATA)>

<!ELEMENT Country (#PCDATA)>

<!ELEMENT Company (#PCDATA)>

<!ELEMENT Price (#PCDATA)>

這段代碼表示:元素CATALOG包含多個(gè)CD子元素,而子元素CD又依次包含Title, Artist, Year, Country, Company, Price 六個(gè)子元素,它們的內(nèi)容都定義為文本(字符,數(shù)字,文本)。(注:具體的語(yǔ)法說明可以看上一章關(guān)于DTD的介紹)

第二步:建立XML文檔。

<?xml version="1.0"?>

<CATALOG>

<CD>

<TITLE>Empire Burlesque</TITLE>

<ARTIST>Bob Dylan</ARTIST>

<COUNTRY>USA</COUNTRY>

<COMPANY>Columbia</COMPANY>

<PRICE>10.90</PRICE>

<YEAR>1985</YEAR>

</CD>

<CD>

<TITLE>Hide your heart</TITLE>

<ARTIST>Bonnie Tylor</ARTIST>

<COUNTRY>UK</COUNTRY>

<COMPANY>CBS Records</COMPANY>

<PRICE>9.90</PRICE>

<YEAR>1988</YEAR>

</CD>

<CD>

<TITLE>Greatest Hits</TITLE>

<ARTIST>Dolly Parton</ARTIST>

<COUNTRY>USA</COUNTRY>

<COMPANY>RCA</COMPANY>

<PRICE>9.90</PRICE>

<YEAR>1982</YEAR>

</CD>

<CD>

<TITLE>Still got the blues</TITLE>

<ARTIST>Gary More</ARTIST>

<COUNTRY>UK</COUNTRY>

<COMPANY>Virgin redords</COMPANY>

<PRICE>10.20</PRICE>

<YEAR>1990</YEAR>

</CD>

<CD>

<TITLE>Eros</TITLE>

<ARTIST>Eros Ramazzotti</ARTIST>

<COUNTRY>EU</COUNTRY>

<COMPANY>BMG</COMPANY>

<PRICE>9.90</PRICE>

<YEAR>1997</YEAR>

</CD>

</CATALOG>

上面代碼首先用<?xml version="1.0"?>聲明語(yǔ)句表明這是一個(gè)XML文檔,它的格式遵守XML 1.0標(biāo)準(zhǔn)規(guī)范。然后是文檔內(nèi)容,結(jié)構(gòu)樹非常清晰:

<CATALOG>

<CD>

......

</CD>

<CD>

......

</CD>

</CATALOG>

一共定義了5組數(shù)據(jù)。我們將上面的代碼存為cd.xml文件,以備調(diào)用。

第三步:建立相應(yīng)的HTML文件。

1.導(dǎo)入XML數(shù)據(jù)。

我們知道,目前流行的瀏覽器中,暫時(shí)只有微軟的IE5.0以上版本瀏覽器支持XML。IE是通過在HTML中的object物件來支持插入XML,并通過js的XMLDocument.load()方法來導(dǎo)入數(shù)據(jù)。我們看代碼: <object WIDTH="0" HEIGHT="0"

CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID="xmldso">

</object>

定義一個(gè)object,ID名為xmldso。然后在head區(qū)用js引入xml數(shù)據(jù):

<script for="window" event="onload">

xmldso.XMLDocument.load("cd.xml");

</script>

2.捆綁數(shù)據(jù)。

然后將用<SPAN>標(biāo)識(shí)來將XML數(shù)據(jù)綁定在表格中。其中ID,DATASRC,DTATFLD都是<SPAN>的屬性。代碼如下:

<table>

<tr><td>Title:</td><td><SPAN ID="title" DATASRC=#xmldso DATAFLD="TITLE"></SPAN></td></tr>

<tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=#xmldso DATAFLD="ARTIST"></SPAN></td></tr>

<tr><td>Year:</td><td><SPAN ID="year" DATASRC=#xmldso DATAFLD="YEAR"></SPAN></td></tr>

<tr><td>Country:</td><td><SPAN ID="country" DATASRC=#xmldso DATAFLD="COUNTRY"></SPAN></td></tr>

<tr><td>Company:</td><td><SPAN ID="company" DATASRC=#xmldso DATAFLD="COMPANY"></SPAN></td></tr>

<tr><td>Price:</td><td><SPAN ID="price" DATASRC=#xmldso DATAFLD="PRICE"></SPAN></td></tr>

</table>

3.動(dòng)作操作。

最后,為數(shù)據(jù)提供瀏覽按鈕:

<INPUT TYPE=button VALUE="上一張CD" ONCLICK="moveprevious()">

<INPUT TYPE=button VALUE="下一張CD" ONCLICK="movenext()">

并利用js來完成兩個(gè)鼠標(biāo)點(diǎn)擊功能:movenext()和moveprevious()。在head區(qū)加入如下代碼:

<script language="JavaScript">

function movenext()

{

if (xmldso.recordset.absoluteposition < xmldso.recordset.recordcount)

{

xmldso.recordset.movenext();

}

}

function moveprevious()

{

if (xmldso.recordset.absoluteposition > 1)

{

xmldso.recordset.moveprevious();

}

}

</script>

好,我們先看HTML文件的全部原代碼:

<html>

<head>

<script for="window" event="onload">

xmldso.XMLDocument.load("cd.xml");

</script>

<script language="JavaScript">

function movenext()

{

if (xmldso.recordset.absoluteposition < xmldso.recordset.recordcount)

{

xmldso.recordset.movenext();

}

}

function moveprevious()

{

if (xmldso.recordset.absoluteposition > 1)

{

xmldso.recordset.moveprevious();

}

}

</script>

<TITLE>CD Navigate</TITLE>

</head>

<body>

<p>

<object WIDTH="0" HEIGHT="0"

CLASSID="clsid:550dda30-0541-11d2-9ca9-0060b0ec3d39" ID="xmldso">

</object>

<table>

<tr><td>Title:</td><td><SPAN ID="title" DATASRC=#xmldso DATAFLD="TITLE"></SPAN></td></tr>

<tr><td>Artist:</td><td><SPAN ID="artist" DATASRC=#xmldso DATAFLD="ARTIST"></SPAN></td></tr>

<tr><td>Year:</td><td><SPAN ID="year" DATASRC=#xmldso DATAFLD="YEAR"></SPAN></td></tr>

<tr><td>Country:</td><td><SPAN ID="country" DATASRC=#xmldso DATAFLD="COUNTRY"></SPAN></td></tr>

<tr><td>Company:</td><td><SPAN ID="company" DATASRC=#xmldso DATAFLD="COMPANY"></SPAN></td></tr>

<tr><td>Price:</td><td><SPAN ID="price" DATASRC=#xmldso DATAFLD="PRICE"></SPAN></td></tr>

</table>

<p>

<INPUT TYPE=button VALUE="上一張CD" ONCLICK="moveprevious()">

<INPUT TYPE=button VALUE="下一張CD" ONCLICK="movenext()">

</p>

</body>

</html>

將以上代碼存為cd.htm文件,于第二步的cd.xml文件放在一起。打開cd.htm文件,你就看見和上面實(shí)例一樣的效果了。

好,到今天為止,我們已經(jīng)學(xué)習(xí)了關(guān)于XML的不少知識(shí),我們來總結(jié)一下前面五個(gè)章節(jié),分別是XML快速入門,XML的概念原理,XML的術(shù)語(yǔ),XML的語(yǔ)法和本章的實(shí)例解析。到這里,教程部分就結(jié)束了。在寫作過程中,阿捷盡最大努力將有關(guān)XML概念講得通俗易懂,盡量把自己的理解告訴給大家,但因?yàn)楸救藢W(xué)習(xí)XML時(shí)間也不長(zhǎng),對(duì)整個(gè)XML的技術(shù)把握還不夠系統(tǒng)和深入,所以難免有疏漏的地方,請(qǐng)大家指正和諒解,謝謝!

<完>

更多信息請(qǐng)查看IT技術(shù)專欄

更多信息請(qǐng)查看網(wǎng)絡(luò)編程
易賢網(wǎng)手機(jī)網(wǎng)站地址:XML 輕松學(xué)習(xí)手冊(cè)(比較不錯(cuò))
由于各方面情況的不斷調(diào)整與變化,易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考,敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)!

2025國(guó)考·省考課程試聽報(bào)名

  • 報(bào)班類型
  • 姓名
  • 手機(jī)號(hào)
  • 驗(yàn)證碼
關(guān)于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡(jiǎn)要咨詢 | 簡(jiǎn)要咨詢須知 | 加入群交流 | 手機(jī)站點(diǎn) | 投訴建議
工業(yè)和信息化部備案號(hào):滇ICP備2023014141號(hào)-1 云南省教育廳備案號(hào):云教ICP備0901021 滇公網(wǎng)安備53010202001879號(hào) 人力資源服務(wù)許可證:(云)人服證字(2023)第0102001523號(hào)
云南網(wǎng)警備案專用圖標(biāo)
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關(guān)注公眾號(hào):hfpxwx
咨詢QQ:526150442(9:00—18:00)版權(quán)所有:易賢網(wǎng)
云南網(wǎng)警報(bào)警專用圖標(biāo)