介绍 Darwin 信息分类体系结构--面向可移植的技术信息

2002-8-19 16:12:57【作者】 畅享网 【进入论坛】
广告

介绍 Darwin 信息分类体系结构

--面向可移植的技术信息


Don R. Day (
dond@us.ibm.com)

Michael Priestley

Dave A. Schell

IBM 公司

2001 年 3 月

Darwin 信息分类体系结构 (DITA) 是用于创作、制作和交付技术信息的基于 XML 的体系结构。本文介绍了这个体系结构,阐明了用于在主题级别上创建信息分类的模块和以交付方式,如,在线帮助和在 Web 上的产品支持门户,使用该内容,提出了一组设计原则。本文作为 Darwin 信息分类体系结构的指南,指出了: Darwin 信息分类体系结构是什么以及它是如何应用到技术文档。本文链接到代表性的源代码。

基于 XML 的 Darwin 信息分类体系结构 (DITA) 是用于创建和交付模块化技术信息的端到端体系结构。这个体系结构包含了一组设计原则,用于创建信息分类主题模块和以不同方式使用其内容,例如在线帮助或在 Web 上的产品支持门户。从本质上来看,DITA 是一种体现了许多这些设计原则的 XML 文档类型定义 (DTD)。然而,这个体系结构是用于技术信息的这种提议书的定义部分;DTD,或基于它的任何模式仅是该体系结构设计原则的具体实例。

背景

这个体系结构和 DTD 是由来自于 IBM、Lotus 和 Tivoli 的代表用户辅助小组的跨公司工作组设计的。在 1999 年后期最初的调查之后,工作组通过公布到数据库和每周的电话会议,在 2000 年合作开发出这种体系结构。我们现在在 IBM 的 developerWorks Web 站点上提供这个体系结构,这个体系结构是作为基于 XML 的文档系统的替代品,被设计成利用 XML 作为其编码格式。

信息互换,工具管理和可扩展性

IBM,其产品拥有上万页的文档,早在 90 年代初期它就有了自己的非常复杂的 SGML DTD,IBMIDDoc 来支持这种文档。工作组从一开始就不得不考虑“为什么不只是转换 IBMIDDoc,或使用现成的 XML DTD,如,DocBook 或 TEI 或 XHTML?”答案需要反映有关技术信息的本质。

首先 SGML 和 XML 都被认为是元语言,这种元语言允许数据拥有者社区以反映他们如何开发、存储和处理信息方式去描述他们的信息资源。因为表达知识与企业文化和社区术语有紧密的联系,所以大多数试图定义出一个通用 DTD 都以无法使用或未完成而告终。理想的信息互换是与其它拥有数据的社区共享信息的语义学和转换规则。

其次,大多数公司都依赖于许多交付系统;各个公司都以极其不同的方法来处理信息。因此,任何建立一个通用工具集的尝试被认为是徒劳的。理想的工具管理是在标准之上建立处理体系结构,而且利用许多其它贡献的经验,从而能在一个广阔的社区内解决公共的问题。

再次,作为捕获现今数据扑货拥有者的商务实践的信息建模,大多数试图使文档描述词汇(DTD 或模式)形式的工作已经完成。这种方法往往是将旧有实践编成 DTD 或词汇表。对于技术信息(或在前沿科技上持续开发的任何信息)而言,DTD 中未来扩展的理想作法是将有关自顶至下的处理系统的最少可能化假设构建到 DTD 设计中。

一开始,工作组就试图了解在前沿信息技术中 XML 的角色。随着工作的进展,小组开始意识到任何 DTD 设计效果都必须解决大多数词汇、工具无关的处理范例和信息结构的全新观点。许多当前 DTD 合并了处理这些问题的方法,但这些问题所涉及的范围往往超出了 DTD。为了支持许多产品、品牌、公司、风格和交付方式,我们必须考虑整个创作到交付的过程。我们最终得到需要我们将设计表示成信息体系结构的一系列建议书,而不是仅仅是一个 DTD 。

作为基本体系结构单元的主题

主题是用来描述单一任务或概念或引用项的信息单元。信息的类别(概念、任务、引用)是其信息类型。分类的主题很容易在内容管理系统中作为可重用的独立信息单元管理。比如说,在交付上下文中选择的主题可以收集、安排和处理,以提供各种交付,如,用于复查的近期更新主题的组、用于构建到用户辅助的应用程序帮助集或者甚至小册子(从用户选择的搜索结果或“购物列表”打印的)中的章节或部分。

作者从基本主题 DTD 的结构专门化介绍这一新的信息类型(在同伴所写的文章中在 Darwin 信息分类体系结构中的专门化有详细的说明)。

DITA 概述

Darwin 信息分类体系结构在文件的各个部分,处理器和用户社区信息之间,定义了一组关系。

如图 1 所示,Darwin 信息分类体系结构有 4 层,它与在引用 DTD ditabase 中表示的特定设计点相关联 。

图 1. Darwin 信息分类体系结构中的层


分类的主题 — 无论是概念、任务或引用 — 是可发布信息的一个独立单元。在分类的主题层之上是可以由超集 DTD 驱动的任何处理应用程序;在它的下面是在体系结构内,形成所有专门化 DTD 的两种内容模型。接下来,我们再进一步详细查看每一层。

DITA 交付上下文

交付上下文域表示用于主题信息的处理层。主题可以单一的或在上下文的交付中处理,主题都是将多个主题与定义的交付相关。上下文的交付还包括文档管理系统、创作单元、翻译包等等。

DITA 分类主题结构

分类主题表示 DITA 面向主题内容的基本结构层。体系结构的基础是主题结构,从主题结构可使概念、任务和引用结构专门化。通过专门化,就有可能扩展到其他分类主题。

四类信息(主题、概念、任务和引用,我们称之为 reftopic)表示于文档产品社区使用的主要内容类别。此外,以四种原始类型为基础的专门化信息类型可以根据需要定义。

作为此体系结构的一个显著特性,其他社区可以通过使用公共和共享结构扩展或定义表示他们自身数据的附加信息类型。这种内容的示例包括产品支持信息、编程消息描述和 GUI 定义。

DITA 公共结构

元数据和表结构都是可使用在任何一个主题中,甚至是其它的 XML 词汇表中不可更改的结构。

元数据结构定义了个别主题、更高级处理 DTD 甚至对于作为副文件(sidefile)或者甚至是数据记录与元数据相联系的 HTML 文档的文档控制信息。

表结构为主体级内容提供表示语义。许多流行的 XML 编辑器中都支持 CALS 显示模型。

DITA 共享结构

共享结构提供可运用在许多类型的技术文档中的元素和内容模型。这些包括基本文档结构(强调和布局的字处理器等价)、 XHTML 1.0 的复制和粘贴兼容子集和语义上内容的重要短语和结构。

图 2. 共享结构层


工作组努力选出 HTML 流行和通用的元素名称。并且某些语义学名称从工业 DTD 中借用,这种工业 DTD 是支持大型 SGML 库,例如 IBMIDDoc 和 DocBook。

专门化

有特定信息需要的公司可以定义专门的主题类型。例如,产品组可能标识 3 种主要类型的引用主题:信息、实用程序和 API。对于内容的每一类型,通过创建专门的主题类型,产品体系结构能够确保主题的每一类型都有适当的内容。另外,专门化的主题使支持 XML 的搜索更加有效,因为用户可以清楚的区分。例如,对于 xyz 用户可以限制仅在信息或仅在 API 中搜索。用户一般还可以跨引用主题搜索 xyz。

规则负责如何专门化安全性:每个新信息分类必须映射到现有的而且在它允许的内容内有更多的限制。有了这样的专门化,新信息类型可以对翻译、打印和 Web 发布使用类属处理流。虽然产品组可以覆盖或扩展这些过程,在不需要任何额外工作或维护,他们缺省可以获得全部现有过程。

一个公司可以有一组 DTD,这些 DTD 表示一组一致的信息描述,它们中的每一个都强那些调新信息类型的专门化值。

DITA 中内容社区的角色

设计这个体系结构的技术文档定义了基本体系结构和共享资源。由特定社区(定义社区内或外)拥有的内容可以重用处理器、样式和其它已定义的特性,但那些社区根据他们管理的数据定义了独一无二的商业过程。通过进一步专门化基本类型之一,他们可以做到这一点。

图 3显示了作为主题级的内容拥有者的社区是如何基于核心体系结构来使他们的内容专门化。

图 3. 专门化社区到基本体系结构的关系

在图 3中,重叠部分代表使用这个信息体系结构的内容拥有社区共享的一般体系结构和工具。那些定义分类文档的新社区可以根据体系结构然后从一开始就使用同样的工具,并根据需要改进其内容特定的工具。

参考资料

在我的同伴所写的文章中,在 Darwin 信息分类结构中的专门化,查找更多关于 DITA 的信息,该文略述了如何实现 DITA。

如何加入 DITA 论坛的讨论,由 Don Day 和 Michael Preistley 主持。

直接进入 DITA 论坛,由 Don Day 和 Michael Preistley 主持。

下载 DITA DTD、样式表和样本文档。

参阅 DITA FAQ 集合

可以在 Argus Center for Information Architecture10 Questions about Information Architecture site 上了解有关信息体系结构主题的背景知识。

关于作者

Don R. Day

Don 是位丈夫、父亲和爱猫者,他为 IBM 的信息开发社区设计和支持出版工具,并代表 IBM 参加 W3C XSL 和 CSS 工作组。他持有英语和新闻专业的学士学位以及新墨西哥州立大学技术和职业通讯专业的硕士学位。

Michael Priestley

Michael Priestley 是 IBM 多伦多软件开发实验室的信息开发人员。他写了大量论文,如,超文本导航、singlesourcing 和动态文档的接口。他目前进行帮助和文档管理方面的 XML 和 XSL。

Dave A. Schell

Dave Schell 是 IBM 支持技术写作(用户技术)社区方面的主战略家和工具领导。

如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐
jill.jiang@amteam.org | 021-51096826-112 | 在线联系
老孙的IT运维管理之道[原创]用户的BSM用户的IT业务管..

从企业实际的IT运营角度来看,BSM是推动IT与业务融合,实现、改善WCNG司IT管理和治理的最佳实践之一。

吕建伟 专栏和CIO问答软件项目实施管理

现实中很少能按照正规流程来的,所以只能把流程中的各个环节拆开,个个击破,以后就可以见招拆招了。

节能与优化IT 企业CIO过冬良策

当前金融危机的影响还在继续漫延,很多企业都在苦寻过冬的良策,在这种情况下,节能与优化技术与产品无疑成为CIO们关注的首要对象,本次选题就是针对节能与优化IT来为CIO们提供过冬的良……

观08软件并购风潮 议09巨头何处生花

2008,似乎注定是不平静的一年。有人说2008是并购年。业内人士表示,在全球软件行业,并购一直是大企业谋求做大做强的捷径之一,包括甲骨文、SAP,微软等全球软件巨头都为了扩大自己……