在当前的网络信息时代,信息量不仅庞大而且源自于不同的数据源,信息集成一直是研究的热点。基于多代理(Multi-Agent)的信息资源集成方案有所不足,而XML集成机制的优点,适于网络环境下基于XML的信息集成。本方案:包括系统的总体框图、层次结构、工作过程及信息系统主要部分的具体设计。
随着计算机技术,特别是Internet的不断发展,实现"信息孤岛"之间的集成与交互成为亟待解决的问题。![]() 图1 XML相关标准 |
XML基础标准是为XML的进一步实用化制定的标准,它规定了采用XML制定标准时的一些公用特征、方法或规则。XML Schema描述了更加严格定义XML文档的方法,以便可以更自动地处理XML文档。XML Namespace用于保证XML DTD中名字的一致性,以便不同的DTD中的名字在需要时 可以合并到一个文档中。DOM定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。 XQuery的目的是为从Web文档中提取数据,提供一种灵活的查询机制。XPath描述如何识别、选择、匹配XML文件中的各个构成元件,包括元素、属性、文字内容等。XPointer和XLink标准,规定了有关定位、链接方面的内容。CSS被用来作为XML文档显示的样式标准等等。
2、XML的主要技术特点
XML是一种元标记语言,强调以数据为核心,这两大特点在XML的众多技术特点中最为突出,同时也奠定了XML在信息管理中的优势。
XML是一种元标记语言
与HTML不同,XML不是一种具体的标记语言,它没有固定的标记符号,是一种元标记语言,是一种用来定义标记的标记语言,它允许用户自己定义一套适于应用的DTD。
XML的核心是数据
在一个普通的文档里,往往混合有文档数据、文档结构、文档样式三个要素。而对于XML文档来说,数据是其核心。将样式与内容分离,是XML的巨大优点。一方面可以使应用程序轻松的从文档中寻找并提取有用的数据信息,而不会迷失在混乱的各类标签中;另一方面,由于内容与样式的独立,也可以为同一内容套用各种样式,使得显示方式更加丰富、快捷。
3、DTD(Document Type Define,文档类型定义)
DTD的作用是定义允许或不允许什么在文档中出现。DTD的结构:一般由元素类型声明、属性表声明、实体声明、记号声明等构成。一个典型的文档类型定义文件会把未来所要创作的XML文档的元素结构、属性类型、实体引用等预先进行规定。用户既可以直接在XML文档中定义DTD,也可以通过URL引用外部的DTD。DTD位XML文档的编写者和处理者提供了共同遵循的原则,使得与文档相关的各种工作有了统一的标准。
在当前的网络信息时代,信息量不仅庞大而且源自于不同的数据源,信息集成一直是研究的热点。基于多代理(Multi-Agent)的信息资源集成方案有所不足,而XML集成机制的优点,适于网络环境下基于XML的信息集成。本方案:包括系统的总体框图、层次结构、工作过程及信息系统主要部分的具体设计。
基于XML的信息集成方案
1、于XML的信息集成总体框图
图2给出基于XML的信息集成的总体框图[1],是把来自供应链节点上的、不同数据源(数据库,构件库,领域知识库)的信息通过包装器(Wrapper)转换成XML数据,存储在虚拟集中存储器中,用户通过DOM/SAX来获取已经转换成XML格式的信息;同样,用户通过DOM/SAX接口提交的查询命令,通过包装器转换成本地数据源能够识别的数据格式进行查询。用户通过XML的封装体实现彼此之间的交互,而不需要了解对方的数据格式。
![]() 图3 基于XML的信息集成层次结构 |
![]() 图4 Wrapper生成器和Wrapper |
/*个人特性*/ Creat table Trait( PersonID CHAR(3), Name CHAR(10), BirthDate DATE, Address CHAR(30), IdentifyId CHAR(18) ) /*治疗信息*/ Creat table Treatment( TreatID NUMBER(6,0), Drugname CHAR(20), TreatNote CHAR(50), PersonID CHAR(3) ) <!ELEMENT Trait(Name,BirthDate,Address,IdentifyId)> <!ATTLIST Trait PersonID IDREF # REQUIRED> <!ELEMENT Name(#PCDATA)> <!ELEMENT BirthDate(#PCDATA)> <!ELEMENT Address(#PCDATA)> <!ELEMENT IdentifyID(#PCDATA)> <!ELEMENT Treatment(Drugname*,TreatNote,PersonID)> <!ATTLIST Treatment TreatID ID # REQUIRED> <!ELEMENT Drugname (#PCDATA)> <!ELEMENT TreatNote (#PCDATA)> <!-This filerepresents a fragment of a telemedicine data--> |
在当前的网络信息时代,信息量不仅庞大而且源自于不同的数据源,信息集成一直是研究的热点。基于多代理(Multi-Agent)的信息资源集成方案有所不足,而XML集成机制的优点,适于网络环境下基于XML的信息集成。本方案:包括系统的总体框图、层次结构、工作过程及信息系统主要部分的具体设计。
DOM客户端API的设计
DOM全称是Document Object Model,是一个文件对象所组成的模型。它不光用于XML,最早是用于HTML的。DOM定义了一组分析元可以显示的标准指令集,通过程序存取HTML或XML的内容,然后通过程序中的对象集合将其显示出来。
我们可以通过创建Document对象,使得应用程序得到对XML文档进行操作的入口。进一步通过直接加载XML文档把创建的这个文档对象同实际的XML文档关联起来。从而将XML文档转换成一个DOM对象模型,为上层提供访问服务。
下面的例子结合VBScript和XML DOM对象来生成XML数据:
<SCRIPT LANGUAGE=VBScript> <!-- Sub dombml_OnClick() Set dom_xml=CreateObject("Microsoft.XMLDOM") dom_xml.async=False dom_xml.loadXML"<?xml version=’1.0’?>" &_ "<personalinfo>" &_ " <name> " & namel.Value &_ " </name> " &_ " <id> " & id.Value &_ " </id> " &_ " <password> " &password.Value &_ " </password> " &_ " <email> " &email.Value &_ " </email> " &_ "</persomalinfo>" aler(dom_xml.XML) End Sub --> </SCRIPT> <html> <head><title>利用DOM对象来生成XML数据</title></head> <body> <hr> 姓名: <Input id=namel> <br> 用户名: <input id=id> <br> 密码 <input type="password" id=password> <br> 电子邮件 <input id=email> <Input type=Button id=domxml value="生成XML数据"> </body> </html> |