总的说来的面向内容管理领域的XML应用可分为五类: 1. 应用系统内部的数据一个大型应用系统内部可能涉及多个数据源,这些数据源包括文件系统、数据库系统,他们之间的数据格式复杂且异构,同时系统不同功能模块之间所采用的数据模型也可能存在差异。在数据交换过程中将源数据采用基于XML的统一数据模型进行表示,可以有效地解决数据访问统一接口问题。由此提出了在多种不同数据源之间实现基于异构数据模型的数据之间转换的研究课题。笔者所在的研究室研发的XML Transformer系统在很大程度上有效地解决了关系数据库与XML之间以及基于两种异构模式的XML文件之间的数据转换问题。
2. 实现通用分布式计算环境 XML技术的应用将改变传统"客户/服务器"工作模式中将运算负荷集中在固定服务器端的模式,而是将其按需分布在客户端和分布式计算环境下的不同服务器上。Web服务的产生和发展就是这种应用的成功印证。Web服务已经从面向传统计算设备的应用领域扩展到了移动计算领域。微软与英国沃达丰在今年10月13日在瑞士日内瓦举行的世界电信联盟展"TELECOM WORLD 2003"大会上宣布将携手进行手机数据服务开发。微软将针对沃达丰的手机服务,提供基于XML的Web服务解决方案。通过利用Web服务,可以在个人电脑中作为应用程序嵌入信息收发、位置信息及收费等手机才有的功能,从而提供扩大应用软件的机会,促进普及可以在个人电脑和移动环境下无缝运行的解决方案。 在Web环境下,基于XML的数据处理技术的另一个重要的应用领域就是基于XML的半结构化信息处理。Web与传统的文档管理系统结合在一起构成了一个巨大的、异构且分布式的文档仓库,其中比重最大的数据是半结构化文档。传统数据库的检索查询机制以及统计学分析方法已经远远不能够满足半结构化信息处理的需求。笔者所在的研究室研究并开发的半结构化信息智能处理模型TIPSI(The Intelligence Processor of Semi-structured Information),其研究目标是将内容与样式混合的半结构化文档作为输入,通过对文档知识和元数据的利用将半结构化文档转换为能够提供良好信息复用性且基于XML的多视图表示,从而实现针对该类文档的复杂查询服务、基于中介的信息系统和基于代理的应用服务系统。
3. 实现不同软件构件的互操作越来越多的不同类型的应用软件中所采用的数据文件格式已经或者即将采用XML标准来定义。在面向各种应用领域的XML标准不断推出的同时,相关专用软件的开发市场也呈现飞速发展的态势。 富士通的美国子公司 -- -- 富士通软件(Fujitsu Software),推出了基础件模块套件"Interstage Suite"。该套件将企业门户、综合软件工具、数据分析软件以及XML检索引擎融合在一起。其中"Interstage XML Search"XML数据的高速检索功能。不论数据大小以及所在位置,均可进行XML数据报告、文献的查询。能够同时进行产生100项或者1000项结果的检索。"Interstage XBRL Processor"作为构筑和配备基于XBRL(eXtensible Business Reporting Language)的应用软件的工具包,能够对互连网中的多数软件形式和技术间进行自动交换和抽取金融数据。"Interstage Portal"则使企业能够统一各种各样分散型的系统和服务,并向用户、员工、顾客以及合作伙伴提供统一的操作界面。 XML数据处理软件不但适用于传统以PC和服务器为主的计算平台,而且已经延伸到了移动计算平台。在移动计算技术成熟且普及的日本市场中,这类软件不断推陈出新。KDDI研究所日前成功使用Java语言开发出了面向手机的矢量形式图像显示格式定义语言SVG的专用浏览器(图1)。该浏览器依据SVG Mobile规范,配备了SVG图像的显示、放大、缩小等功能,应用于地图信息服务,可在KDDI的手机上运行,用来显示商店、餐馆的位置信息等。 微软将Office 2003的设计完全建立在XML技术基础之上的举动更证明了将XML数据作为应用软件数据文件的定义标准已经成为大势所趋。Office 2003能够将不同的应用软件数据以XML的形式保存下来,