XML认证教程,第 4 部分: XSL样式单

来源:互联网 发布:linux修改文件 编辑:程序博客网 时间:2024/06/11 10:23

<script type="text/javascript">google_ad_client = "pub-5033576919944123";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";//2007-10-24: csdn.bloggoogle_ad_channel = "8548491739";</script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>

XML认证教程,第 4 部分: XSL样式单

 

 

对于一批XML数据,应用处理程序要综合XML文档、文档类型说明(Dtd/Schema) 以及样式单三方面要素来处理和显示它。

什么是样式单

对于一批XML数据,应用处理程序要综合XML文档、文档类型说明(Dtd/Schema)以及样式单三方面要素来处理和显示它。

在XML文档中只包含了数据信息,并没有涉及文档如何显示。不错,制定XML标准的目的是要使数据结构化,赋予其明确的语意,使之易于进行数据交换。XML早已不再把目光局限在文字图象的显示上,而是要建立它们之间的内在关系。可以说,XML文档本身是重内容而不重形式。

可是,XML结构化地组织信息固然好,但如果不加修饰地把一大堆枯燥的数据摆在那里,也足以令人眼花头痛。

样式单(StyleSheet)是一种专门描述结构文档表现方式的文档,它既可以描述这些文档如何在屏幕上显示,也可以描述它们的打印效果,甚至声音效果。样式单一般不包含在XML文档内部,而以独立的文档方式存在。

样式单可以实现非常复杂的显示效果,但由于样式描述与数据描述相分离,显示细节的描述并不影响文档中数据的内在结构。

样式单的最大优点是:XML关于文档浏览的基本思想是将数据与数据的显示分别定义。这样一来,XML格式文档不会重蹈某些HTML文档结构混杂、内容繁乱的覆辙,XML的编写者也可以集中精力于数据本身,而不受显示方式的细枝末节的影响。不仅如此,样式单还带来另一个好处,即定义不同的样式表可以使相同的数据呈现出不同的显示外观,从而适合于不同应用,甚至能够在不同的显示设备上显示。这样,XML数据就可以得到最大程度上的重用性,满足不同的应用需求。





XSLT

W3C已经给出了两种样式单语言的推荐标准,一种是层叠样式单CSS(Cascading Style Sheets),另一种是可扩展样式单语言XSL(eXtensible Stylesheet Language)。本章讲的是XSL。

XSL本身就是一个XML文档,它是通过XML进行定义的,遵守XML的语法规则,是XML 的一种具体应用。因此系统可以使用同一个XML解释器对XML文档及其相关的XSL文档进行解释处理。XSL由两大部分组成:第一部分描述了如何将一个XML文档进行转换,转换为可浏览或可输出的格式;第二部分则定义了格式对象FO(fomatted object)。由于到目前为止,W3C还未能出台一个得到多方认可的FO,因此本章主要XML变换--XSL transformations(XSLT)。现在一般所说的XSL大都指的是XSLT。





XSLT的应用

XSLT主要的功能就是转换,它将一个没有形式表现的XML内容文档作为一个源树,将其转换为一个有样式信息的结果树。在XSLT文档中定义了与XML文档中各个逻辑成分相匹配的模板,以及匹配转换方式。它可以很好地描述XML文档向任何一个其它格式的文档作转换的方法,例如转换为另一个逻辑结构的XML文档、HTML文档、 XHTML文档、VRML文档、SVG文档等等,不一而足。

使用XSL定义XML文档显示方式的基本思想是:通过定义转换模板,将XML源文档转换为带样式信息的可浏览文档。

限于目前浏览器的支持能力,大多数情况下是转换为一个HTML文档进行显示。

在XML中声明XSL样式单的方法为:<?xml-stylesheet type="text/xsl" href="mystyle.xsl"?>
至于具体的转换过程,既可以在服务器端进行,也可以在客户端进行。





XSLT样式单文档举例

下面是一个具体的xslt样式单文档:

 <?xml version="1.0" encoding="gb2312" ?>  <xsl:stylesheet xmlns:xsl="http://www.w3.org/tr/WD-xsl">  <xsl:template match="/">  <HTML> <HEAD> <TITLE>学生花名册</TITLE> <STYLE> .title{font-size:15pt; font-weight:bold; color:blue } .name{color:red}</STYLE> </HEAD> <BODY> <P class="title" >学生花名册</P> <xsl:apply-templates select="学生花名册"/> </BODY> </HTML>  </xsl:template>   <xsl:template match="学生花名册">  <table BORDER="1"> <THEAD>   <td> <B>姓名</B> </td>  <td> <B>籍贯</B> </td>   <td> <B>年龄</B> </td>   <td> <B>电话</B> </td> </THEAD><xsl:for-each select="学生" order-by="名字"> <tr>   <td><B><xsl:value-of select="名字"/></B></td>   <td><xsl:value-of select="籍贯"/></td>   <td><xsl:value-of select="年龄"/></td>   <td><xsl:value-of select = "电话号码"/></td> </tr></xsl:for-each>   </table>  </xsl:template>  </xsl:stylesheet>





模板在XSLT中的应用

将上例的XML文档用XSL样式转换为HTML文档的步骤是:先用XML解释器将XML文档解释成DOM对象,相当于建立了原文档的一个节点树。然后用XML解释器解释XSL文档,用模板匹配的方法去遍历XML节点树,将树中的节点按模板的设定转换为模板指示的显示语言,即HTML语言。

要了解这段程序,就要先了解模板。xsl:template是模板元素,用于定义模板,通常每个xsl:template有一个节点匹配属性,由"match="指定。在对模板进行匹配时使用"xsl:apply-templates",用"select"属性选择要匹配的模板,相当于一个调用的过程。比如在
<xsl:apply-templates select="学生花名册"/>
这段语句中用到了xsl:apply-templates,于是系统就跳到了用<xsl:template match="学生花名册">括起的“函数”中生成HTML代码。

如果在xsl:apply-templates语句中没有指定select属性,那么就调用所有可以调用的模板。

接着介绍xslt常用的几条语句。

  • 介绍一下XSL的几条主要语句:
  • xsl:stylesheet 声明语句
  • xsl:for-each select = "" 循环语句,遍历与引号中的属性值相同的节点
  • xsl:value-of select = "" 赋值语句,取出引号中指定的属性值

 





分析XSLT代码执行过程

在作过XML声明和XSL声明之后,系统最先匹配XML源树的根节点。根节点用"/"表示,它的匹配方法在一对<xsl:template match="/">括起的源码中声明。按照这段代码,首先生成带有样式信息的HTML文档的开头一段代码:

 <HTML>   <HEAD>     <TITLE>学生花名册</TITLE>     <STYLE> .title{font-size:15pt; font-weight:bold; color:blue }.name{color:red}    </STYLE>   </HEAD>   <BODY>     <P class="title" >学生花名册</P>  

接着,系统看到了<xsl:apply-templates select="学生花名册"/>的指示,于是,它在XML源树中寻找标记为“学生花名册”的节点进行匹配。就象函数调用一样,现在系统跳到了用<xsl:template match="学生花名册">括起的“函数”中继续生成下面的 HTML代码:

  <table BORDER="1">      <THEAD>        <td> <B>姓名</B> </td>       <td> <B>籍贯</B> </td>        <td> <B>年龄</B> </td>        <td> <B>电话</B> </td>       </THEAD> 

现在,系统又接到了新的指示 <xsl:for-each select="学生" order-by="名字">。这条指示要求系统寻找标记为“student”的子节点,并按照“名字”下的内容将这些节点排序,然后一一处理。

对于每一个“学生”子树中的内容,系统为其生成表中一行的内容。每一行包含四列,分别把标记为“名字”、“籍贯”、“年龄”、“电话号码”的子节点的内容填进去。其中“名字”下的内容还是粗体显示。对应到本例中的XML数据,生成的HTML代码为:

    <tr>       <td><B>李华</B></td>       <td>河北</td>       <td>15</td>       <td>62875555</td>     </tr>     <tr>       <td><B>张三</B></td>       <td>北京</td>       <td>14</td>       <td>82873425</td>     </tr>

处理完<xsl:for-each select="学生" order-by="名字">中的内容,系统继续生成HTML代码:

</table> 

至此,系统已处理完<xsl:template match="学生花名册">中的所有内容,可以“函数返回”了。系统返回到<xsl:template match="/">括起的源码中,完成HTML最后两行代码的生成:

</BODY></HTML> 

把上面的HTML代码串起来,就是生成的转换结果文件。





XSLT文件文档结构

前面说过,XSLT文档本身是XML文档,因此文档的第一句自然是:

<?xml version="1.0" encoding="gb2312"?> 

接下来是样式单部分:

  <xsl:stylesheet version="1.0"        xmlns:xsl="http://www.w3.org/tr/WD-xsl">... ...  </xsl:stylesheet>

xmlns:xsl指示了XSL的命名空间,在XSLT标准中,定义了XSLT的命名空间为 http://www.w3.org/1999/XSL/transform,然而在ie5中不支持这个名字空间,需要用到微软自己的名字空间http://www.w3.org/tr/WD-xsl。

XSLT在进行转换时,首先遍历XML源文档树,找到要处理的节点,然后将定义好的模板信息施加到该节点中。
下面将要介绍xslt样式单的语法。





样式单模板xsl:template

xsl:template元素有一个mode属性,可以根据需要去匹配不同模式的模板。若将前例作如下修改:

<xsl:template match="/" mode="blue"> ...<TITLE>学生花名册</TITLE> <STYLE> .title{font-size:15pt; font-weight:bold; color:blue }...<xsl:template match="/" mode="red"> ...<TITLE>学生花名册</TITLE> <STYLE> .title{font-size:15pt; font-weight:bold; color:red }

如果要将TITLE输出为蓝色,则用下面语句匹配:
<xsl:apply-templates select="/" mode="blue"/>

如果要将title输出为红色,则写为:
<xsl:apply-templates select="/" mode="red"/>

此外,模板总是与节点相对应的,一个节点可能对应于不同的模板,那么如何确定各模板匹配的先后次序呢?XSLT中可为xsl:template设置优先级,写法是:
<xsl:template match="student" priority="n"> //n为优先级数





xsl:value-of计算节点值

在使用XSLT进行转换时,常常需要获取节点值,使用xsl:value-of元素可达到这个目的,如下例:
<xsl:value-of select="籍贯"/>

得到的是学生原籍的值,select属性指定要获取的是哪一个节点的节点值。





xsl:for-each循环处理

使用xsl:for-each可对所选节点依次进行处理,如例中在生成表格处理中,就是利用循环将各个学生的信息取出放入表格中的,写法是:

<xsl:for-each select="student" order-by="name"> ... </xsl:for-each> 

可以认为<xsl:for-each select="">能实现多个 <xsl:apply-templates select="">的功能。





xsl:sort排序处理

对于用xsl:for-each或xsl:apply-templates匹配的节点,可使用xsl:sort将所选节点内容进行排序

  1. 按大小写排序
    <xsl:sort case-order="upper-first" select="@id"/> 以id为关键字按大写优先排序
    <xsl:sort case-order="lower-first" select="@id"/> 以id为关键字按小写优先排序
  2. 按字母顺序排序
    <xsl:sort order="ascending" select="@id "/> 以id为关键字按字母升序排序
    <xsl:sort order="descending" select="@id "/> 以id为关键字按字母降序排序
  3. 按数据类型排序
    <xsl:sort data-type="text" select="@id"/> 以id为关键字按文本类型排序,如对于一组id数据101,2,44,305 来说,排序结果是101,2,305,44
    <xsl:sort data-type="number" select="@id"/> 以id为关键字按数据类型排序,上面一组数据的排序结果是2,44,101,305
    另外,还有一种指定排序的方法,就是在前面学生花名册例中所使用的order-by: <xsl:for-each select="student" order-by="name"> 也可使得输出学生时按名字排序。




元素与属性创建

XSLT是一个动态的样式单,在处理过程中可产生新的元素或元素属性,方法如下:

内 容 元 素 举 例 转换结果 创建元素 xsl:element <xsl:element name="TITLE">学生花名册</xsl:element> 学生花名册 创建属性 xsl: attribute <TITLE><xsl:attribute name="style">color:blue </xsl:attribute>学生花名册</TITLE > <TITLE style="color:blue">学生花名册</TITLE> 创建文本 xsl:text (可以保护文本中的空白字符) <xsl:text> 这是学生花名册 </xsl:text > 这是学生花名册 创建处理指令 xsl:processing-instruction <xsl:processing-instruction name="xml-stylesheet"> href="book.css" type="text/css" </xsl:processing-instruction> <?xml-stylesheet href="book.css" type="text/css"?> 创建注释 xsl:comment <xsl:comment> 以下是学生花名册,请勿删改! </xsl:comment> <!-- 以下是学生花名册,请勿删改!-->



节点拷贝

在对XML文档进行处理时,XSLT还可以通过拷贝的方式复制节点,方法是利用 xsl:copy和xsl:copy-of。其中xsl:copy只拷贝当前节点,不包括子节点和属性;而xsl:copy-of的拷贝内容则包括当前节点、子节点和属性。例如对于:
<p id="p1">A <B>is a char</B> </p>

如果样式单写为如下形式:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/transform"> <xsl:template match="p">   <DIV><xsl:text> copy-of : </xsl:text> <xsl:copy-of select="."/>   </DIV>   <DIV><xsl:text> copy : </xsl:text> <xsl:copy/>   </DIV> </xsl:template> </xsl:stylesheet> 

转换后生成如下代码:

<DIV>   copy-of : <p id="p1">A <B>is a char</B> </p></DIV><DIV>   copy : <p/></DIV> 

由此可见,两种拷贝方式结果大相径庭。





输出格式与编码问题

XSLT是一个转换语言,它的目的是将XML源文档转换为另一种格式文档,它的输出结果可以是HTML文档,也可以是带CSS的XML文档。具体的输出格式由xsl:output 指定。如果要输出为HTML文档,则写为: <xsl:output method="html"/>

同样,要输出XML文档写为: <xsl:output method="xml"/>

如果文档中不出现xsl:output,将缺省输出为XML文档,但如果在匹配模板时使用了 <HTML>标记,则输出为HTML文档。输出为HTML文档时系统都会自动加上下面语句: <!DOCTYPE html PUBLIC "-//W3C//Dtd HTML 4.0 transitional//EN">

此外,还可以利用xsl:output指定编码方式,如UTF-8,UTF-16,GB2312等。例如: <xsl:output method="html" encoding="GB2312"/> 它指定了该XSLT的输出结果是HTML格式,编码方式为中文。


<script type="text/javascript">google_ad_client = "pub-5033576919944123";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";//2007-10-24: csdn.bloggoogle_ad_channel = "8548491739";</script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>