XML入门

来源:互联网 发布:ug8.5安装java失败 编辑:程序博客网 时间:2024/06/11 18:31

XML入门

什么是XML?

1)       XML是EXtensibleMarkupLanguage的缩写;

2)       XML是一种类似于HTML的标记语言;

3)       XML是用来描述数据的;

4)       XML的标记不是在XML中预定义的,你必须定义自己的标记;

5)       XML使用文档类型定义(DTD)或者模式(Schema)来描述数据;

6)       XML使用DTD或者Schema后就是自描述的语言。

XML和HTML的主要区别是什么?

XML是用来存放数据的

1)       XML不是HTML的替代品,XML和HTML是两种不同用途的语言;

2)       XML是被设计用来描述数据的,重点是:什么是数据,如何存放数据;

3)       HTML是被设计用来显示数据的,重点是:显示数据以及如何显示数据更好上面;

4)       HTML是与显示信息相关的,XML则是与描述信息相关的。

XML 什么也不做

XML 被设计成什么都不做的。

也许看起来很难理解,但事实上XML确实什么都不做。XML只是用来组织、存储和发送信息的。

下面的例子是Ordm给Lin的便条,使用的是XML格式:

<note>

<to>Lin</to>

<from>Ordm</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

这个便条有信息头,又信息主体,还包括发送人和接收人。尽管如此,这个XML文档仍然什么都不做,他只是用XML标记存储信息的文件。有人已经编写出来发送和接收并且显示这种格式信息的软件。

XML是自由的、可以扩展的

XML标记并不是预先规定好的,你必须创造你自己的标记。

在HTML文档中必须使用规则中定义好的标记。比如:<P><br><a></a>等等。

XML允许你定义自己的标记以及文档结构。

比如在上面例子中的"<to>"、"<from>"标记都不是在XML规范中事先定义好的。这些标记都是XML文档的作者“创造”出来的。

XML是HTML的补充

XML并不是HTML的替代品。

XML并不是HTML的替代品,理解这一点非常重要。在将来的网页开发中,XML将被用来描述、存储数据,而HTML则是用来格式化和显示数据的。

对于XML最好的形容可能是:XML是一种跨平台的,与软、硬件无关的,处理信息的工具。

XML在未来Web开发中的应用

XML无处不在

XML发展的非常迅速,这实在令人感到惊奇,有很多的软件开发商都采用了XML标准。

我们相信,在未来的Web开发中,XML将和HTML一样受到重视,他们都是Web技术的基础。XML将成为最普遍的数据操纵和数据传输的工具。

如何使用XML?

首先要明确的是:XML是被设计用来存储数据、携带数据和交换数据的,他不是为了显示数据而设计的。

XML可以从HTML中分离数据

通过XML,你可以在HTML文件之外存储数据。

在不使用XML时,HTML用于显示数据,数据必须存储在HTML文件之内;使用了XML,数据就可以存放在分离的XML文档中。这种方法可以让你集中精力去到使用HTML做好数据的显示和布局上,并确保数据改动时不会导致HTML文件也需要改动。这样可以方便维护页面。

XML数据同样可以以“数据岛”的形式存储在HTML页面中。你仍然可以集中精力到使用HTML格式化和显示数据上去。

XML用于交换数据

通过XML,我们可以在不兼容的系统之间交换数据。

在现实生活中,计算机系统和数据库系统所存储的数据有N^N种形式,对于开发者来说,最耗时间的就是在遍布网络的系统之间交换数据。

把数据转换为XML格式存储将大大减少交换数据是的复杂性,并且还可以使得这些数据能被不同的程序读取。

XML 和 B2B

使用XML,可以在网络中交换金融信息。

在不远的将来,我们可以期望看到很多关于XMl和B2B(Business To Business)的应用。

XML正在成为遍布网络的商业系统之间交换金融信息所使用的主要语言。许多与B2B有关的完全基于XML的应用程序正在开发中。

XML可以用于共享数据

通过XML,纯文本文件可以用来共享数据。

既然XML数据是以纯文本格式存储的,那么XML提供了一种与软件和硬件无关的共享数据方法。

这样创建一个能够被不同的应用程序读取的数据文件就变得简单了。同样,我们省级操作系统、升级服务器、升级应用程序、更新浏览器就容易多了。

XML可以用于存储数据

利用XML,纯文本文件可以用来存储数据。

大量的数据可以存储到XML文件中或者数据库中。应用程序可以读写和存储数据,一般的程序可以显示数据。

XML可以充分利用数据

使用XML,你的数据可以被更多的用户使用。

既然XML是与软件、硬件和应用程序无关的,所以可以使你的数据可以被更多的用户、更多的设备所利用,而不仅仅是基于HTML标准的浏览器哦。

别的客户端和应用程序可以把你的XML文档作为数据源来处理,就像他们对待数据库一样,你的数据可以被各种各样的“阅读器”处理,这时对某些人来说是很方便的,比如盲人或者残疾人。

XML可以用于创建新的语言

XML是WAP和WML语言的母亲。

无线标记语言(WML,The Wireless Markup Language ),用于标识运行于手持设备上(比如:手机)的Internet程序。

WML采用了XML的标准。你可以在WML指南中详细的了解。

XML 语法

XML的语法规则既简单又严格,非常容易学习和使用。

正因为如此,编写读取和操作XML的软件也是相对容易的事情。

一个XML文档的例子

XML文档使用了自描述的和简单的语法。

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<note>

<to>Lin</to>

<from>Ordm</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

文档的第1行:XML声明——定义此文档所遵循的XML标准的版本,在这个例子里是1.0版本的标准,使用的是ISO-8859-1 (Latin-1/West European)字符集。文档的第2行是根元素(就象是说“这篇文档是一个便条”):

<note>

文档的第3--6行描述了根元素的四个子节点(to, from, heading,和 body):

<to>Lin</to>

<from>Ordm</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

文档的最后一行是根元素的结束:

</note>

你能从这个文档中看出这是Ordm给Lin留的便条么?难道能不承认XML是一种美丽的自描述语言么?

所有的XML文档必须有一个结束标记

在XML文档中,忽略结束标记是不符合规定的。

在HTML文档中,一些元素可以是没有结束标记的。下面的代码在HTML中是完全合法的:

<p>This is aparagraph

<p>This is anotherparagraph

但是在XML文档中必须要有结束标记,像下面的例子一样:

<p>This is aparagraph</p>

<p>This is anotherparagraph</p> 

注意:你可能已经注意到了,上面例子中的第一行并没有结束标记。这不是一个错误。因为XML声明并不是XML文档的一部分,他不是XML元素,也就不应该有结束标记。

XML标记都是大小写敏感的

这与HTML不一样,XML标记是大小写敏感的。

在XML中,标记<Letter>与标记<letter>是两个不同的标记。

因此在XML文档中开始标记和结束标记的大小写必须保持一致。

<Message>This isincorrect</message>   //错误的

<message>This iscorrect</message>     //正确的

所有的XML元素必须合理包含

在XML中不允许不正确的嵌套包含。

在HTML中,允许有一些不正确的包含,例如下面的代码可以被浏览器解析:

<b><i>Thistext is bold and italic</b></i>

在XML中所有元素必须正确的嵌套包含,上面的代码应该这样写:

<b><i>Thistext is bold and italic</i></b>

所有的XML文档必须有一个根元素

XML文档中的第一个元素就是根元素。

所有XML文档都必须包含一个单独的标记来定义,所有其他元素的都必须成对的在根元素中嵌套。XML文档有且只能有一个根元素。

所有的元素都可以有子元素,子元素必须正确的嵌套在父元素中,下面的代码可以形像的说明:

<root>

<child>

<subchild>.....</subchild>

</child>

</root>

属性值必须使用引号""

在XML中,元素的属性值没有引号引着是不符合规定的。

如同HTML一样,XML元素同样也可以拥有属性。XML元素的属性以名字/值成对的出现。XML语法规范要求XML元素属性值必须用引号引着。请看下面的两个例子,第一个是错误的,第二个是正确的

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<notedate=12/11/99>

<to>Lin</to>

<from>Ordm</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

 

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<notedate="12/11/99">

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

第一个文档的错误之处是属性值没有用引号引着。

正确的写法是:date="12/11/99". 不正确的写法:date=12/11/99.

使用XML,空白将被保留

在XML文档中,空白部分不会被解析器自动删除。

这一点与HTML是不同的。在HTML中,这样的一句话:

"Hello             my name is Ordm"将会被显示成:“Hello my name is Ordm”,

因为HTML解析器会自动把句子中的空白部分去掉。

使用XML,CR / LF 被转换为 LF

使用 XML,新行总是被标识为 LF(Line Feed,换行)。

你知道打字机是什么吗?呵呵,打字机是在上个世纪里使用的一种专门打字的机器。

当你用打字机敲完一行字后,你通常不得不再把打字头移动到纸的左端。

在Windows应用程序中,文本中的新行通常标识为 CR LF (carriage return, line feed,回车,换行)。在Unix应用程序中,新行通常标识为 LF。还有一些应用程序只使用CR来表示一个新行。

XML中的注释

在XML中注释的语法基本上和HTML中的一样。

<!-- 这是一个注释 -->

XML并没有什么特别的哦

XML确实没有什么特别的地方。他只是一些用尖括号扩在一起的普通的纯文本。

编辑普通文本的软件也可以编辑XML文档。

然而在一个支持XML的应用程序中,XML标记往往对应着特殊的操作,有些标记可能是可见的,而有些标记则可能不会显示出来,而不会有什么特殊的操作。

XML元素

XML元素是可以扩展的,它们之间有关联。

XML元素有简单的命名规则。

XML元素是可以扩展的

XML文档可以被扩展一边携带更多的信息。

请看下面的XML便条例子:

<note>

<to>Lin</to>

<from>Ordm</from>

<body>Don't forgetme this weekend!</body>

</note>

让我们来设想一个能够读取此XML文档的并能解读其中XML元素(<to>, <from>, 和<body>)的软件,可能的输出如下:

MESSAGE

To: Lin
From: Ordm

Don't forget me thisweekend!

我们再来设想,如果便条的作者Ordm在这个XML文档中加入一些额外的信息,如下所示:

<note>

<date>2002-12-24</date>

<to>Lin</to>

<from>Ordm</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

那么原来的应用程序会中断或者崩溃么?

不会。应用程序仍然会正确的解读<to>, <from>, 和<body> 等元素,并且产生同样的输出。

XML文档是可以扩展的!

XML元素是相互关联的

XML元素之间是父元素和子元素的关系。

为了更好的理解XML术语,必须了解XML元素之间的关系如何,以及元素的内容是如何被描述的。

设想有这样一本书:

署名: XML指南

第一章: XML入门简介

什么是HTML

什么是XML

第二章: XML语法

XML元素必须有结束标记

XML元素必须正确的嵌套

我们可以用XML文档来描述这本书:

<book>

<title>XML 指南</title>

<prodid="33-657" media="paper"></prod>

<chapter>XML入门简介

<para>什么是HTML</para>

<para>什么是XML</para>

</chapter>

<chapter>XML语法

<para>XML元素必须有结束标记</para>

<para>XML元素必须正确的嵌套</para>

</chapter>

</book>

在上面的代码中,Book元素是XML文档的根元素,title元素和chapter元素是book元素的子元素。Book元素是title元素和chapter元素的父元素。title元素,prod元素和chapter元素是平级元素,因为他们都有同一个父元素。

XML元素的内容

XML元素有不同的内容。

XML元素指的是从该元素的开始标记到结束标记之间的这部分内容。

XML元素有元素内容,混合内容,简单内容或者空内容。每个元素都可以拥有自己的属性。

在上面的例子中,book元素有元素内容,应为book元素包含了其它的元素。Chapter元素有混合内容,因为它里面包含了文本和其他元素。para元素有简单的内容,因为它里面仅有简单的文本。prod元素有空内容,因为他不携带任何信息。

在上面的例子中,只有prod元素有属性,id属性值是33-657,media属性值是paper。

XML元素命名

XML元素命名必须遵守下面的规则:

1)       元素的名字可以包含子母,数字和其他字符。

2)       元素的名字不能以数字或者标点符号开头。

3)       元素的名字不能以XML(或者xml,Xml,xMl...)开头。

4)       元素的名字不能包含空格。

自己“发明”的XML元素还必须注意下面一些简单的规则:

任何的名字都可以使用,没有保留字(除了XML),但是应该使元素的名字具有可读性,名字使用下划线是一个不错的选择。

例如:<first_name>, <last_name>.

尽量避免使用“-”,“.”,因为有可能引起混乱。

只要你愿意元素的名字可以很长,但也不要太夸张了哦。命名应该遵循简单易读的原则,例如:<book_title>是一个不错的名字,而<the_title_of_the_book>则显得罗嗦了。

XML文档往往都对应着数据表,我们应该尽量让数据库中的字段的命名和相应的XML文档中的命名保持一致,这样可以方便数据变换。

非英文/字符/字符串也可以作为XML元素的名字,例如<蓝色理想><经典论坛>这都是完全合法的名字。但是有一些软件不能很好的支持这种命名,所以尽量使用英文字母来命名。

在XML元素命名中不要使用":",因为XML命名空间需要用到这个十分特殊的字符。

XML 属性

跟HTML一样,XML元素再开始标记处可以由元素属性。

属性通常包含一些关于元素的额外信息。

XML属性

XML元素可以拥有属性。

你一定还记得这样的HTML代码吧:<IMG SRC="computer.gif">。src是img元素的属性,提供了关于img元素的额外信息。

在HTML中 (在XML中也一样)元素的属性提供了元素的额外信息。

<imgsrc="computer.gif">

<ahref="demo.asp">

书信提供的信息通常不是数据的一部分。在下面的例子中,类型和数据毫不相关,但对于操作这个元素的软件来说却相当重要。

<filetype="gif">computer.gif</file>

引用风格"female"还是 'female'?

属性值必须用引号引着。单引号、双引号都可以使用。例如一个人的性别,person元素可以这样写:

<personsex="female">

也可以这样写:

<personsex='female'>

上面的两种写法在一般情况下是没有区别的,使用双引号的应用更普遍一些。但是在某些特殊的情况下就必须使用单引号,比如下面的例子:

<gangster name='George"Shotgun" Ziegler'>

使用子元素还是使用属性

数据既可以存储在子元素中也可以存储在属性中。

请看下面的例子:

<personsex="female">

<firstname>Anna</firstname>

<lastname>Smith</lastname>

</person>

 

<person>

<sex>female</sex>

<firstname>Anna</firstname>

<lastname>Smith</lastname>

</person>

在第一个例子中,sex是一个属性,在第二个例子中,sex则是一个子元素。这两个例子都提供了相同的信息。

什么时候用属性,什么时候用子元素没有一个现成的规则可以遵循。我的经验是属性在HTML中可能相当便利,但在XML中,你最好避免使用。

我喜欢的风格

我更愿意把数据存储到子元素中。

下面的三个XML文档包含了相同的信息:

第一个例子使用了data属性:

<notedate="12/11/99">

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

第二个例子使用了data元素:

<note>

<date>12/11/99</date>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

第三个例子使用了扩展的data元素: (这就是我推荐的样式):

<note>

<date>

<day>12</day>

<month>11</month>

<year>99</year>

</date>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

避免使用属性?

应该避免使用属性么?

这里有一些使用属性引发的问题:

1)       属性不能包含多个值(子元素可以)。

2)       属性不容易扩展。

3)       属性不能够描述结构(子元素可以)。

4)       属性很难被程序代码处理。

5)       属性值很难通过DTD进行测试。

如果使用属性来存储数据,那么所编写的XML文档一定很难阅读和操作。尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。

不要像下面的例子那样(如果你那么做了说明你还没有明白上面的观点)。

<noteday="12" month="11" year="99"

to="Tove"from="Jani" heading="Reminder"

body="Don't forgetme this weekend!">

</note>

属性规则的例外

规则总是有例外的。

我的关于属性的规则也有一个例外:

有些时候应该为一个元素设计一个ID引用,通过这个ID可以引用存取特定的XML元素,就像HTML中的name和id属性一样。请看下面的例子:

<messages>

<noteID="501">

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

<noteID="502">

<to>Jani</to>

<from>Tove</from>

<heading>Re:Reminder</heading>

<body>I willnot!</body>

</note>

</messages>

在上面的例子中,ID属性就相当于一个计数器,或者是一个唯一的标识符,在XML文档中标识不同的便条信息,他不是便条信息的一部分。

我们所要尽力向读者说明的是:元数据(与数据有关的数据)应该以属性的方式存储,而数据本身应该以元素的形式存储。

XML 确认

符合语法的XML文档称为结构良好的XML文档。

通过DTD验证的XML文档称为有效的XML文档。

“结构良好的” XML文档

一个结构良好的XML文档应该使用正确的语法。

一个结构良好的XML文档应该遵守XML语法规则,前面一章给出的例子就是一个结构良好的XML文档:

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

“有效的”XML文档

一个有效的XML文档应该遵守DTD的描述。

一个有效的XML文档也是一个结构良好的XML文档,同时还必须符合DTD的规则。

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<!DOCTYPE note SYSTEM"InternalNote.dtd">

<note>

<to>Tove</to>

<from>Jani</from>

<heading>Reminder</heading>

<body>Don't forgetme this weekend!</body>

</note>

XML DTD

DTD定义了XML文档中可用的合法元素。

DTD的意图在于定义XML文档的合法建筑模块。他通过定义一系列合法的元素决定了XMl文档的内部结构。结构良好的XML文档不一定是有效的XML文档,但有效的XML文档一定是结构良好的XML文档。如果你想了解更多关于DTD的知识可以参考DTD指南

XML Schema 

XMLSchema(XML模式)是基于XML的DTD的替代品。

W3C使得DTD和Schema可以相互替代,读者可以在Schema指南中了解到更多信息。

错误

XML文档中发生的错误将导致XML程序停止。

W3C的XML规范声明:如果程序在处理XML文档中发现一个有效的错误,那么此程序应该终止。这就是XML软件相对于容易编写的原因。所有的XML文档地都应该是协调一致的。

在HTML中,HTML文件可能包含很多错误,(比如一个元素有开始标记没有结束标记)这也是HTML浏览器体积之所以很大的一个原因,当他们发现错误的时候,他们有各自不同的方法来决定此HTML文件应该如何显示。

在XML中决不会发生这种情况。

微软的XML解析器

XML解析器可以读取、更新、创建、操作一个XML文档。

使用XML解析器

微软的XML解析器是和IE5.0+浏览器捆绑在一起的。

一旦你安装了IE5.0,那么就获得了XML解析器。这个浏览器除了被浏览器内部调用外,还可以在脚本中或者程序中调用。这个解析器的特点是支持与程序设计语言无关的编程模型,他支持以下技术:

1)       JavaScript, VBScript, Perl, VB, Java, C++ 等等

2)       W3C XML 1.0 和 XML DOM

3)       DTD 和 XML文档验证

如果浏览器使用JavaScript作为脚本语言,那么利用下面的代码可以创建XML文档对像:

var xmlDoc=newActiveXObject("Microsoft.XMLDOM")

如果浏览器使用VBScript作为脚本语言,那么利用下面的代码可以创建XML文档对像:

set xmlDoc=CreateObject("Microsoft.XMLDOM")

如果在ASP程序中使用VBScript脚本语言,那么就可以使用下面的代码形式:

setxmlDoc=Server.CreateObject("Microsoft.XMLDOM")

将XML文档载入解析器

使用脚本代码可以将XML文档载入解析器。

下面的代码可以将一个XML文档载入解析器:

<scripttype="text/javascript">

var xmlDoc = new ActiveXObject("Microsoft.XMLDOM")

xmlDoc.async="false"

xmlDoc.load("note.xml")

// ....... processing thedocument goes here

</script>

第二行代码创建Microsoft XML解析器的实例。

第三行代码关闭异步载入,确保XML解析器在把XML文档完全载入以前不会对XML文档进行解析。

第四行则告诉解析器需要载入的XML文档名字是note.xml。

把纯XML文档由字符载入解析器

解析器可以从一个文本字符串中载入XML文本。

下面的代码演示了将文本字符串载入解析器:

<scripttype="text/javascript">

vartext="<note>"

text=text+"<to>Tove</to><from>Jani</from>"

text=text+"<heading>Reminder</heading>"

text=text+"<body>Don'tforget me this weekend!</body>"

text=text+"</note>"

var xmlDoc = newActiveXObject("Microsoft.XMLDOM")

xmlDoc.async="false"

xmlDoc.loadXML(text)

// ....... processing thedocument goes here

</script>

注意这里载入字符串使用的是"loadXML()"方法)(而不是前面用过的"load()"方法), "loadXML()"是用于载入字符串,"load()"是用于载入XML文档。

使用JavaScript语言显示XML数据

可以使用JavaScript语言来显示XML数据。

JavaScript (或者 VBScript)可以从XML文档中导入数据,并将这些数据在HTML页面中显示出来。

下面我们来看一下XML和HTML是如何进行相互之间的互补的,首先来看一个XML 文档 (note.xml), 然后我们看一个包含了导入XML文档兵显示在HTML页面中的JavaScript脚本代码的HTML文档(note.htm) 。

去看看他是如何工作的,自己尝试一下吧

你可以在我们的DOM School中了解更多的关于JavaScript的知识。

XML 命名空间

XML 命名空间提供了一种避免元素命名冲突的方法。

命名冲突

因为XML文档中使用的元素不是固定的,那么两个不同的XML文档使用同一个名字来描述不同类型的元素的情况就可能发生。而这种情况又往往会导致命名冲突。请看下面两个例子

这个 XML 文档在table元素中携带了水果的信息:

<table>

<tr>

<td>Apples</td>

<td>Bananas</td>

</tr>

</table>

这个 XML 文档在table元素中携带了桌子的信息(家具,不能吃的哦):

<table>

<name>AfricanCoffee Table</name>

<width>80</width>

<length>120</length>

</table>

如果上面两个XML文档片断碰巧在一起使用的话,那么将会出现命名冲突的情况。因为这两个片断都包含了<table>元素,而这两个table元素的定义与所包含的内容又各不相同。

使用前缀解决命名冲突问题

下面的XML文档在table元素中携带了信息:

<h:table>

<h:tr>

<h:td>Apples</h:td>

<h:td>Bananas</h:td>

</h:tr>

</h:table>

下面的XML文档携带了家具table的信息:

<f:table>

<f:name>AfricanCoffee Table</f:name>

<f:width>80</f:width>

<f:length>120</f:length>

</f:table>

现在已经没有元素命名冲突的问题了,因为这两个文档对各自的table元素使用了不同的前缀,table元素在两个文档中分别是(<h:table> 和<f:table>)。

通过使用前缀,我们创建了两个不同的table元素。

使用命名空间

下面的XML文档在table元素中携带了信息:

<h:tablexmlns:h="http://www.w3.org/TR/html4/">

<h:tr>

<h:td>Apples</h:td>

<h:td>Bananas</h:td>

</h:tr>

</h:table>

下面的XML文档携带了家具table的信息:

<f:tablexmlns:f="http://www.w3schools.com/furniture">

<f:name>AfricanCoffee Table</f:name>

<f:width>80</f:width>

<f:length>120</f:length>

</f:table>

在上面两个例子中除了使用前缀外,两个table元素都使用了xmlns属性,使元素和不同的命名空间关联到一起。

命名空间属性

命名空间属性一般放置在元素的开始标记处,其使用语法如下所示:

xmlns:namespace-prefix="namespace"

在上面的例子中,命名空间定义了一个Internet 地址:

xmlns:f="http://www.w3schools.com/furniture"

W3C 命名规范声明命名空间本身就是一个统一资源标示符,Uniform Resource Identifier(URI)。

当我们在元素的开始标记处使用命名空间时,该元素所有的子元素都将通过一个前缀与同一个命名空间相互关联。

注意:用来标识命名空间的网络地址并不被XML解析器调用,XML解析器不需要从这个网络地址中查找信息,该网络地址的作用仅仅是给命名空间一个唯一的名字,因此这个网络地址也可以是虚拟的,然而又很多公司经常把这个网络地址值像一个真实的Web页面,这个地址包含了关于当前命名空间更详细的信息。

可以访问http://www.w3.org/TR/html4/.

统一资源标识符

通用资源标识符(A Uniform Resource Identifier (URI))是一个标识网络资源的字符串。最普通的URI应该是统一资源定位符Uniform Resource Locator (URL)。URL用于标识网络主机的地址。另一方面,另一个不常用的URI是通用资源名字Universal Resource Name (URN)。在我们的例子中,一般使用的是URLs。

既然前面的例子使用的URL地址来标识命名空间,我们可以确信这个命名空间是唯一的。

默认的命名空间

定义一个默认的XML命名空间使得我们在子元素的开始标记中不需要使用前缀。他的语法如下所示:

<elementxmlns="namespace">

下面的XML文档在table元素中包含了水果的信息:

<tablexmlns="http://www.w3.org/TR/html4/">

<tr>

<td>Apples</td>

<td>Bananas</td>

</tr>

</table>

下面的XML文档包含了家具table的信息:

<tablexmlns="http://www.w3schools.com/furniture">

<name>AfricanCoffee Table</name>

<width>80</width>

<length>120</length>

</table>

使用命名空间

档开始使用XSL的时候,就会发现命名空间使用的是如此频繁。XSL样式单主要用于将XML文档转换成类似于HTML文件的格式。

如果看一下下面的XSL文档,就会发现有很多标记都是HTML标记。那些标记并不是HTML标记,是加了前缀的XSL,这个XSL前缀由命名空间"http://www.w3.org/TR/xsl"所标识:

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<xsl:stylesheetxmlns:xsl="http://www.w3.org/TR/xsl">

<xsl:templatematch="/">

<html>

<body>

<tableborder="2" bgcolor="yellow">

<tr>

<th>Title</th>

<th>Artist</th>

</tr>

<xsl:for-eachselect="CATALOG/CD">

<tr>

<td><xsl:value-ofselect="TITLE"/></td>

<td><xsl:value-ofselect="ARTIST"/></td>

</tr>

</xsl:for-each>

</table>

</body>

</html>

</xsl:template>

</xsl:stylesheet>

XML CDATA

在XML文档中的所有文本都会被解析器解析。

只有在CDATA部件之内的文本会被解析器忽略。

解析数据

XML 解析器通常情况下会处理XML文档中的所有文本。

当XML元素被解析的时候,XML元素内部的文本也会被解析:

<message>This textis also parsed</message>

XML解析器这样做的原因是XML元素内部可能还包含了别的元素,像下面的例子,name元素内部包含了first和last两个元素:

<name><first>Bill</first><last>Gates</last></name>

解析器会认为上面的代码是这样的:

<name>

<first>Bill</first>

<last>Gates</last>

</name>

转义字符

不合法的XML字符必须被替换为相应的实体。

如果在XML文档中使用类似"<" 的字符, 那么解析器将会出现错误,因为解析器会认为这是一个新元素的开始。所以不应该像下面那样书写代码:

<message>if salary< 1000 then</message>

为了避免出现这种情况,必须将字符"<" 转换成实体,像下面这样:

<message>if salary&lt; 1000 then</message>

下面是五个在XML文档中预定义好的实体:

&lt;              <         小于号

&gt;             >         大于号

&amp;         &        

&apos;         '          单引号

&quot;         "         双引号

实体必须以符号"&"开头,以符号";"结尾。

注意:只有"<" 字符和"&"字符对于XML来说是严格禁止使用的。剩下的都是合法的,为了减少出错,使用实体是一个好习惯。

CDATA部件

在CDATA内部的所有内容都会被解析器忽略。

如果文本包含了很多的"<"字符和"&"字符——就像程序代码一样,那么最好把他们都放到CDATA部件中。

一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束:

<script>

<![CDATA[

function matchwo(a,b)

{

if (a < b && a< 0) then

{

return 1

}

else

{

return 0

}

}

]]>

</script>

在前面的例子中,所有在CDATA部件之间的文本都会被解析器忽略。

CDATA注意事项:

CDATA部件之间不能再包含CDATA部件(不能嵌套)。如果CDATA部件包含了字符"]]>" 或者"<![CDATA[" ,将很有可能出错哦。

同样要注意在字符串"]]>"之间没有空格或者换行符。

XML编码

XML文档可以包含外文字符比如挪威语或者法语(中文当然也可以!这一部分还是不能照原文翻译,下面有些内容是我自己写的)

为了让你的解析器能够明白这些字符,你必须在XML文档中统一的字符编码标准。

Windows 95/98 记事本

Windows95/98 记事本不能以Unicode的编码格式保存文件。

可以使用记事本来编辑和保存包含了外文字符的XML文档 (比如:挪威语或者法语或者中文)

<?xmlversion="1.0"?>

<note>

<from>小奀</from>

<to>小林</to>

<message>晚上一起去火锅呀</message>

</note>

但是如果你用浏览器打开这个用记事本编辑过的XML文档,将会出现一个错误openit with IE 5.0

在Windows 95/98记事本中使用编码

Windows95/98 记事本编辑XML文件必须进行编码属性设置。

为了避免发生错误,可以在XML文档声明中加上一个encoding属性,指明此XML文档的编码类型,但是不要使用Unicode编码。

下面的编码类型不会导致错误,(IE5.0+浏览器观看),并且汉字显示正常:

<?xmlversion="1.0" encoding="gb2312"?>

下面的编码类型不会导致错误,(IE5.0+浏览器观看),并且汉字显示正常:

<?xmlversion="1.0" encoding="gbk"?>

下面的编码类型不会导致错误,(IE5.0+浏览器观看),并且汉字显示不正常(乱码):

<?xml version="1.0"encoding="windows-1252"?>

下面的编码类型不会导致错误,(IE5.0+浏览器观看),并且汉字显示不正常(乱码):

<?xmlversion="1.0" encoding="ISO-8859-1"?>

下面的编码类型不会导致错误,(IE5.0+浏览器观看),并且汉字显示正常:

<?xmlversion="1.0" encoding="UTF-8"?>

下面的编码类型会导致错误,(IE5.0+浏览器观看):

<?xmlversion="1.0" encoding="UTF-16"?>

使用Windows 2000记事本

Windows2000 记事本可以以Unicode编码格式保存文件。

Windows 2000 的记事本支持Unicode字符集。如果使用Win2000的记事本以Unicode的编码格式保存XML文档(请注意这里在XML声明中没有编码信息):

<?xmlversion="1.0"?>

<note>
<from>
小奀</from>
<to>
小林</to>
<message>
晚上一起去火锅呀</message>
</note>

下面这个文件; note_encode_none_u.xml, 在IE5.0+中将不会出现错误,但如果你使用网景Netscape 6.2,就可能出错。读者比较 note_encode_none.xml 和 note_encode_none_u.xml这两个文件,如果单独看他们各自的源文件,是没有区别的,但为什么一个能显示,一个不能显示呢?答案就是Unicode字符集。

Windows 2000 记事本编码

Windows2000记事本还可以以“UTF-16”编码格式保存文件。

如果你在XML文档中声明了编码属性而又以Unicode编码格式保存文件,将可能发生错误。

下面的代码将会导致错误 (用浏览器察看):

<?xmlversion="1.0" encoding="windows-1252"?>

下面的代码将会导致错误 (用浏览器察看):

<?xmlversion="1.0" encoding="ISO-8859-1"?>

下面的代码将会导致错误 (用浏览器察看):

<?xmlversion="1.0" encoding="UTF-8"?>

下面这个文件; note_encode_utf16_u.xml, 将会在IE5.0+中显示正常,在网景Netscape 6.2浏览器中将会出现错误。

<?xmlversion="1.0" encoding="UTF-16"?>

错误信息

当时用IE5.0或者更高版本浏览XML文档时,可能会遇到两中不同的编码错误:

在文本内容中发现一个非法字符(An invalid character was found in text content)。

如果你的XML文档和你的XML文档的编码格式不匹配就可能导致错误发生。通常情况是,XML文档包含一些“非英文”字符,并且使用了单字节编码的编辑器,而且没有在XML文档的声明中设置XML文档的编码格式。

不支持从当前的编码格式转换成另一种编码格式(Switch from current encoding to specified encoding notsupported)。

如果XML文档以Unicode/UTF-16编码格式保存,但是XML文档的声明中却设置了编码格式是一些单字节的编码(比如 Windows-1252, ISO-8859-1 或者  UTF-8);或者XML文档以单字节编码格式保存,但是XML文档的声明中却设置了编码格式是一些Unicode/UTF-16的编码形式,这样两种情况都会导致错误发生。

结论

结论:在保存XML文档之前在XML文档的声明中设置文档的编码格式,我的一些关于避免错误发生的建议:

1)       使用一种支持Unicode编码格式的编辑器。

2)       确信你知道自己正在使用那种编码格式。

3)       在XML文档中使用属性声明设置编码格式。

简单的XML服务器

不需要安装XML控件就可以在服务器上创建XML文档。

在服务器端存储XML文档

XML文件可以存储在网络服务器中。

就像其他的HTML文件一样,XML文件可以存储在网络服务器上。

打开你的记事本并写入下面的代码: 

<?xmlversion="1.0" encoding="gb2312"?>

<note>

<from>小奀</from>

<to>小林</to>

<message>晚上一起去火锅呀</message>

</note>

然后把这个文件保存到你的服务器上,取名"note.xml"。

注意: 这个XML文件必须和你的其他HTML文件在同一个目录下面,并且 MIME 类型应该设置成 text/xml。

使用ASP产生XML文件

在服务器端即使没有安装XML软件也可以产生XML文件。

为了使服务器端可以对客户端产生动态XML响应,我们可以在的服务器上创建一个包含以下代码的简单的ASP页面:

<%

response.ContentType="text/xml"

response.Write("<?xmlversion='1.0' encoding='gb2312'?>")

response.Write("<note>")

response.Write("<from>小奀</from> ")

response.Write("<to>小林</to>")

response.Write("<message>晚上一起去火锅呀</message> ")

response.Write("</note>")

%>

注意:XML的内容必须设置正确。察看这个ASP页面,如果这个服务器支持ASP的话就会看到显示出来的内容和note.xml文件的一样。

(ASP = Active Server Pages。如果你不知道如何写ASP代码,你可以去参考我们的ASP指南)。

从数据库中产生XML文档

不用安装任何XML软件就可以从数据库中动态的导出XML文档。

我们把前面的例子稍加修改就可以实现从数据库中取得数据了。

下面是一个在服务器端动态生成XML数据的ASP页面例子:

<%

response.ContentType ="text/xml"

setconn=Server.CreateObject("ADODB.Connection")

conn.provider="Microsoft.Jet.OLEDB.4.0;"

conn.openserver.mappath("../ado/database.mdb")

sql="selectfname,lname from tblGuestBook"

set rs=Conn.Execute(sql)

rs.MoveFirst()

response.write("<?xmlversion='1.0' encoding='ISO-8859-1'?>")

response.write("<guestbook>")

while (not rs.EOF)

response.write("<guest>")

response.write("<fname>"& rs("fname") & "</fname>")

response.write("<lname>"& rs("lname") & "</lname>")

response.write("</guest>")

rs.MoveNext()

wend

rs.close()

conn.close()

response.write("</guestbook>")

%>

可以在这里观看实例页面。上面的例子使用了ADO技术,如果你不了解ADO,可以访问我们的ADO指南

XML 应用程序

这一节示范了一个小型的XML应用程序框架。

从XML文档开始

首先我们建立一个简单的XML文档。

来看一下我们原始的XML文档,描述了CD目录。

<?xmlversion="1.0" encoding="ISO-8859-1"?>

<CATALOG>

<CD>

<TITLE>EmpireBurlesque</TITLE>

<ARTIST>BobDylan</ARTIST>

<COUNTRY>USA</COUNTRY>

<COMPANY>Columbia</COMPANY>

<PRICE>10.90</PRICE>

<YEAR>1985</YEAR>

</CD>

.

.

... more ...

如果你使用IE5.0或者更高版本,浏览完整的XML文档。

将XML文档载入数据岛

数据岛可以访问XML文件。

通过数据岛,可以把XML文档引入到HTML页面中。

<xmlsrc="cd_catalog.xml" id="xmldso"async="false">

</xml>

使用上面示例代码,可以把cd_catalog.xml文件载入一个叫"xmldso"的数据岛中。属性async="false"的作用是在HTML处理器开始处理XML数据以前,必须确保XML文档中的所有数据都被载入到内存中。

把XML数据绑定到HTML的表格元素中

HTML中的table元素可以用来显示XML数据。

为了使你的XML数据能在HTML页面中显示出来,必须把的数据岛绑定到一个HTML元素上。

把XML数据绑定到table元素,需要在table属性添加一个资源属性,并且在span元素中添加字段属性:

<tabledatasrc="#xmldso" width="100%" border="1">

<thead>

<th>Title</th>

<th>Artist</th>

<th>Year</th>

</thead>

<tralign="left">

<td><spandatafld="TITLE"></span></td>

<td><spandatafld="ARTIST"></span></td>

<td><spandatafld="YEAR"></span></td>

</tr>

</table>

如果你使用的是IE5.0或者更高版本:观看数据岛绑定的实例

把数据岛绑定到<span>或者<div> 元素上

<span>或<div>元素都可以用来显示XML数据。

没有必要使用table元素来显示XML数据,数据可以通过数据岛绑定到任何一个HTML元素上。

所要做的就是在你得页面中添加一些<span> 或者<div>元素,使用数据资源属性把每一个元素和XML文档元素绑定起来,就像下面这样:

<br />Title:

<spandatasrc="#xmldso" datafld="TITLE"></span>

<br />Artist:

<spandatasrc="#xmldso" datafld="ARTIST"></span>

<br />Year:

<spandatasrc="#xmldso" datafld="YEAR"></span>

或者像这样的形式:

<br />Title:

<divdatasrc="#xmldso" datafld="TITLE"></div>

<br />Artist:

<divdatasrc="#xmldso" datafld="ARTIST"></div>

<br />Year:

<divdatasrc="#xmldso" datafld="YEAR"></div>

如果你使用IE5.0或者更高版本:观看数据绑定到HTML元素上的实例。

注意如果你使用<div>元素,数据将会显示在新的一行里。

上面的例子,可以看到XML数据都显示在一行里。如果要控制数据换行,就必须在你的代码里添加一些脚本程序。

为你的XML数据添加导航脚本

可以通过脚本程序来实现导航功能。

添加数据岛方法,使用脚本函数movenext() 和 moveprevious() 来实现导航功能。

<scripttype="text/javascript">

function movenext()

{

x=xmldso.recordset

if (x.absoluteposition< x.recordcount)

{

x.movenext()

}

}

function moveprevious()

{

x=xmldso.recordset

if (x.absoluteposition> 1)

{

x.moveprevious()

}

}

</script>

如果你使用IE5.0或者更高版本:观看具有导航功能的XML数据绑定实例。

小结

如果你有创造力的话就可以编写出非常完善的应用程序。

如果你使用在这一页中学到的知识,在发挥一下想像力,就可以轻易的创造出完善的应用程序。如果你使用IE5.0或者更高版本:观看一个做了一些修改的数据绑定实例。

XML 技术概要

在这一节里,将要列出一些很重要的XML相关技术。这对理解和开发XML应用程序是很有帮助的。

XHTML - 可扩展HTML(ExtensibleHTML)

XHTML使用XML重新定义了HTML 4.01的语法。XHTML 1.0是HTML的下一个版本。更多的请参考我们的XHTML指南

CSS - 层叠样式表单(Cascading Style Sheets)

CSS样式单可以为XML文档添加显示信息。更多信息请阅读我们的CSS指南

XSL - 可扩展样式单语言(Extensible Style Sheet Language)

XSL由三部分组成:XML文档转换(XML Document Transformation ,又叫XSLT),模式匹配语法( a pattern matchingsyntax ,又叫XPath),格式话对像( aformatting object interpretation,XSL FO)。

XSLT - XML 转换语言(XML Transformation)

XSLT 是一种比CSS强大很多的语言。它可以将XML文档转换成其他格式的文档。更多知识请阅读 XSL指南

XPath - XML匹配模式(XML Pattern Matching)

XPath是一种用于标识XML文档各个部分的语言。这是一种为了XSLT 和 XPointer而设计出来的语言。

XLink - XML链接语言(XML Linking Language)

链接语言(The XML Linking Language ,XLink),允许在不同的XML资源之间建立链接关系。

XPointer - XML指针语言(XML Pointer Language)

XML指针语言(The XML Pointer Language ,XPointer),标识XML文档的内部结构,例如元素、属性、内容等。

DTD - 文档类型定义 (Document Type Definition)

DTD主要用于定义编写XML文档所使用元素。更多知识请参考DTD指南

Namespaces - 命名空间

XML命名空间提供了一种可以把元素、属性、名字和URL地址引用相互关联的方法。

XSD - XML模式(XML Schema)

模式可以和DTD相互替代,并且功能更强大。模式使用XML格式编写,支持命名空间和数据类型。更多请参考 Schema指南

XDR - 数据简化(XML Data Reduced)

XDR是XML模式(XML Schema)的简化版本。IE5.0+浏览器支持XDR。

DOM - 文档对像模型(Document Object Model)

DOM定义了XML文档的接口、属性和方法。更多请参考 DOM指南

XQL - XMl查询语言(XML Query Language)

XQL为存放XML文档中的数据提供一种便捷的查询语言。

SAX - XML的简单API(Simple API for XML)

SAX 是另一种读取和操作XML文档的编程接口。(与DOM类似)

W3C 介绍

互联网组织(The World Wide Web Consortium ,W3C)成立于1994年。主要通过发展各种WWW协议来领导Web。比如HTML,CSS和XML都是由W3C制定的。W3C最重要的工作就是制定网络规范,或者描述一些构造Web的技术。如果想了解更全面的XML标准请访问W3C School

0 0