可扩展标记语言(Extensible Markup Language, XML)是W3C组织于1998年2月发布的标准 。它是为了克服HTML缺乏灵活性和伸缩性的缺点以及SGML过于复杂、不利于软件应用的缺点而发展起来的一种元标记语言 。
SGML功能强大,但是为了能实现强大的功能,要做非常复杂的准备工作 。首先要创建一个文档类型定义,在该定义中给出标记语言的定义和全部规则,然后再编写SGML文档,并把文档类型定义和SGML文档一起发送,才能保证用户定义的标记能够被理解 。
HTML是使用SGML编写出来的最著名的标记语言,经常用它来描述网页中显示某种格式的信息 。HTML简单易学,但也有不足之处:首先,HTML的标记是固定的,不允许用户创建自己的标记;其次,HTML中的标记的作用是描述数据的显示方式,并且只能由浏览器进行处理;另外,在HTML中,所有标记都独立存在,无法显示数据之间的层次关系 。
XML吸取了HTML和SGML的优点,正成为互联网标准的重要组成部分 。在互联网世界中,XML的用途主要有两个:一是作为元标记语言,定义各种实例标记语言标准;二是作为标准交换语言,起到描述交换数据的作用 。
要说明的是:XML不是要替换HTML,实际上XML可以视作对HTML的补充 。XML和HTML的目标不同:HTML的设计目标是显示数据并集中于数据外观,而XML的设计目标是描述数据并集中于数据的内容 。
【例1.9】XML与HTML的比较 。
源代码如下(Ex1-9.htm):
Here we have some text
This is title
This is normal text.
This is bold text. And finally some more normal text
|
如果将上面的代码存为HTML文件(扩展名为.htm或.html),则在浏览器中加载时,显示如图1-11所示的Web页面 。

|
图1-11 在浏览器中显示的HTML文档 |
但如果将上面的代码存为XML文档(扩展名为.xml),则在浏览器中加载时,就将显示如图1-12所示的结果 。
可见,存为XML文档后,浏览器只是把文件中的标记原封不动地显示出来 。此时文件中的标记就不再具有显示格式控制意义,其内容只是说明:
有一个名为Body的标记,在这个标记里面有一些文本 。
有一个名为H1的标记,在这个标记里有一些文本 。
有一个名为P的标记,在这个标记里有一些文本 。
有一个名为B的标记,在这个标记里有一些文本 。
|
图1-12 浏览器中显示的XML文档 |
【责任编辑:老杨 Tel:(010)68576606-8005】