|
解码XML和DTD--编写格式正确和定义明确的XM 的初学者指南广告 解码XML和DTD
VisualAge for Java 支持, IBM 加拿大 2001 年 7 月 这篇介绍性文章说明了如何创建 XML“文档类型定义(DTD)”和格式正确定义明确的 XML 文件,这些文件能够由您选择的 XML
语法分析器进行确认。虽然不必在产生的每个 XML 文件中都包含 DTD,但这样做将会使您的生活大为轻松。DTD 不仅强制使用为 XML
文件建立的语法,它还将允许文件由确认 XML 语法分析器进行语法分析。代码样本包括 DTD 和 XML
文档示例。 在经过一些小调查(请参阅参考资料)后您就会发现市场上到处充斥着 XML 语法分析器,其中大多数都可以从 Web 上免费获得。一个基本的 XML 语法分析器既强调 XML 语法规则(即,确保文件格式正确),又建立文件的有效性。XML 语法分析器可用于几乎每种相关的计算机语言,包括 C、C++、Perl、Python、Tcl 和 Java。 谈到确保 XML 格式正确时,您可以或多或少地指向一个语法分析器然后执行。然而为了确保文档有效,需要为语法分析器提供文档类型定义或 DTD。 本文回顾了 XML 文档格式正确究竟意味着什么,然后会谈到较少讨论的话题确认 -更具体地说,是 DTD。我将讨论为什么您需要将 DTD 包含在 XML 文件中、介绍一些最常用的 DTD 语法,并使用几个简单的样本来教您开始编写自己的 DTD。 为什么要格式正确? 有一个包含所有其它元素的父(或根)元素 清单 1 是一个格式正确的 XML 示例。请注意:该文档的父元素是
清单 1. 格式正确的 XML
清单 2 是一个格式不正确的 XML 示例。它举例说明了三种常见错误。首先,开始和结束 清单 2. 格式不正确的 XML
DTD 中有什么内容? 虽然 DTD 不是必需的,但它们确实带来方便。DTD 适合三个基本用途。它能: 对标记编制文档 清单 3. 精简 person.xml 的 DTD 关于示例的几点说明 第二和第三行包含了元素属性 #PCDATA,它表明 firstname 和 lastname 元素可能包含经过语法分析的字符数据(在这种情况下是文本)。DTD 文件的最后一行描述了一个空标记:nothing。 从清单 3 中的 DTD 可以看出,任何阅读我们的 XML 文档的人(以及对它进行语法分析的语法分析器)都知道 person 元素仅包含两个文本元素:firstname 和 lastname。此外,DTD 规定,在整个文档中,firstname 元素必须在 lastname 元素之前出现。 在转到更复杂的示例之前,让我们回顾一下一些最常用的 DTD 语法元素。可以在 W3C 主页上找到完整的 DTD 规范(请参阅参考资料)。 DTD 语法快速指南 元素必须有正好一个 A、至少一个 B(由加号表示)、零个或多个 C(由星号表示)以及零个或一个 D(由问号表示):
元素不包含任何内容: 元素可以包含在 DTD 中列出的任何元素: 元素可能包含经过语法分析的字符数据或另一个元素(element2)。星号(*)表示混合内容模型 — 其中元素可以包含不同类型的属性。
&element;
如果您对该语法还未完全熟悉,请继续阅读。下一部分中的工作示例应该能帮助您消除疑虑。 工作示例 还可以在参考资料中找到这个文件及其 DTD。 清单 4. people.xml 的完整清单
5000]]> 关于 XML 的几点说明 每个 XML 文档都必须包含这样的一个头,向 XML 语法分析器表示它是一个 XML 文档。头中的下一行告诉 XML 语法分析器该文档是使用什么字符编码来创建的: 在 Unix 系统上创建的 XML 文档和在 Windows 系统上创建的 XML 文档可能有不同的编码。 还可以为第一行设置可选的 standalone 属性。standalone 的缺省值是 no。no 值表示该 DTD 定义是在另一个文件中描述的。yes 值表明该 DTD 应该在 XML 文档内部定义。我没有为示例设置这个属性;如果想设置,它应该看起来如下:
还应该注意使这个文档格式正确的方法。例如,所有空标记都用一个右斜杠结束,如下所示: 还请注意 CDATA 用于对所有若不进行转义就会以 XML 语言解释的任何数据进行转义,例如: 5000]]> 如果适当的格式化,这一行将以文本内容显示:
清单 5. people.dtd 的完整清单
关于 DTD 的几点说明 清单 4 包含了对实体的引用。 实体引用用于代替在 DTD 文档中定义的特定字符或字符串。进行了语法分析后,该实体引用将读作: 还应该注意,
结束语 如果希望了解有关 XML 和 DTD 语法的更多信息,XML 1.0 W3C Recommendation 应该是您的第一站。 Tim Bray 是 XML 1.0 规范的原始编辑之一。他维护着 Textuality.com,可以在上面找到他关于 XML、DTD 等内容思想。还可以找到 Lark 和 Larval,Bray 自己的 XML 语法分析器。 Doug Tidwell 的 教程:XML 简介展示了对“可扩展标记语言”近乎完整的探讨。 您可能还想要仔细查看 Mark Johnson 在 JavaWorld 上发表的 XML for the absolute beginner 一文。 请下载本文示例中使用的 people.xml 和 people.dtd 文件,以进一步研究和分析。 XML 语法分析器:简表 IBM 的 XML Parser for Java (XML4J),目前是版本 3.1.1,是以 100% 纯 Java 编写的确认 XML 语法分析器。包(com.ibm.xml.parser)包含了对 XML 文档进行语法分析、生成、操纵和确认的类和方法。 IBM 的 XML for C++ parser (XML4C) 基于 Apache 的 Xerces-C XML 语法分析器,它是用 C++ 的可移植子集编写的确认 XML 语法分析器。 XML::Parser 是 Perl 扩展模块,充当与 expat 的接口。 TclXML 是全 Tcl 的 XML 语法分析器。 Xerces 是来自 Apache Software Foundation 的 Java 语法分析器,目前是版本 1.4.0。 Lars Marius Goshol 负责维护作为公众服务的这个详尽的 XML 语法分析器列表和其它 XML 工具。 相关链接 在 XML 专区页面上查看最新信息。 如同 DTD,在创建 XML 文件时,样式表不是必需的,但如果希望控制浏览器中文档显示,它们就非常重要。Alan Knox 的 developerWorks 文章,Style sheets can write style sheets, too,向您介绍如何使用 XSL 来将 XML 数据转换成用于浏览器的复杂显示标记。 阅读完上述文章后,可能想要查看 IBM alphaWorks 的 XSL Editor。 如果希望探索 XML Schema 以及它与 DTD 的关系,请参阅 David Mertz 在其 developerWorks 专栏“XML 问题 7”中的 DTD 和 XML Schema 比较,以及 Kevin Williams 的 developerWorks 临时讲台 赞同使用 XMLSchema 的文章来了解用于数据的 XML 文档的结构化定义。有关使用 XML Schema 会怎样的简短说明,请参阅介绍性文章 Basics of using XML Schema to define elements。 Solution 2001 开发人员大会将于 8 月 13 日至 18 日期间在旧金山召开;请在 AgendaBuilder 中搜索或浏览超过 230 个会议的描述。20 多个会议都集中讨论了 XML 和相关技术,包括: Hands-on: Integrating XML with DB2 Hands-on: Voice XML Tools/Building Killer Apps XSL by Example: An Introduction to XML Transformations Parsing
and Programming XML Documents using Java Technology
如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐 jill.jiang@amt.com.cn | 021-51096826-112 | 在线联系 |
CIO职场,强者生存?在2008年,我们将继续看到CIO向商业运营方向发展。与此同时,我们也会看到商业管理人员将与技术管理人员一起竞争CIO岗位。 IT领导者的就职机会虽有不少,但其难度将会大幅提高。2…… 防震减灾,IT当关今天,任何的防震救灾体系,都离不开IT技术。地震观测台是数字化的,震害防御需要对以往的地震信息进行数据分析,应急救援要需要现代多样化的通讯技术。如果说,在许多行业,信息技术还只是一…… |
|
|