我爱电脑技术论坛's Archiver

麦迪 发表于 2008-6-12 06:53

在Java中实现DOM文档和XML文件互相转换

文简要描述了DOM的概念和内部逻辑结构,实例讲述DOM文档操作和XML文件互相转换的java实现过程。 i%V!m0gIb-F!Q

{Sry0{R
@A7Gza%` [ 1. DOM简介
;yr d }9wf{*H{ Z,mlY0WJL^$I.q L-GH
aTU.aU;NP2Z%p?
目前,W3C已于2000年11月13日推出了规范DOM level 2。文档对象模型(DOM)是HTML和XML文档的编程接口规范,它与平台和语言是无关的,因而可以用各种语言在各种平台上实现。该模型定义了THML和XML文件在内存中的逻辑结构(即为文档),提供了访问、存取THML和XML文件的方法。利用DOM规范,可以实现DOM 文档和XML之间的相互转换,遍历、操作相应DOM文档的内容。可以说,要自由的操纵XML文件,就要用到DOM规范。 p%on@6X%z `s
DYCtT ZgZ

oPL0t C o 2. DOM内部逻辑结构 Q%EE#W)v:I b Z

+j_*PzV W'W)ty/`
L%s&G3N uB DOM文档中的逻辑结构可以用节点树的形式进行表述。通过对XML文件的解析处理,XML文件中的元素便转化为DOM文档中的节点对象。DOM的文档节点有Document、Element、Comment、Type等等节点类型,其中每一个DOM文档必须有一个Document节点,并且为节点树的根节点。它可以有子节点,或者叶子节点如Text节点、Comment节点等。任何的格式良好的XML文件中的每一个元素均有DOM文档中的一个节点类型与之对应。利用DOM接口将XML文件转化成DOM文档后,我们就可以自由的处理XML文件了。 Kj1a|'[|
Jn&YA%Ri'J5D;{
)}]|%Pcc5x+b
3. java中的DOM接口
y2doUA7C:ei/o(B1DE } 0g f4PIFX I'[
0hYA [Z v/C4QL`
DOM规范提供的API的规范,目前Sun公司推出的jdk1.4测试版中的java API遵循了 DOM level 2 Core推荐接口的语义说明,提供了相应的java语言的实现。 NO$tQ1{

VP drK/P"Q*n$`
fi8?m,G.I-q 在org.xml.dom中,jkd1.4提供了Document、DocumentType、Node、NodeList、Element、Text等接口,这些接口均是访问DOM文档所必须的。我们可以利用这些接口创建、遍历、修改DOM文档。 hH'U;?x7NC
8\P!xC%_(z

bC3l+`B @ t7\ 在javax.xml.parsers中,jkd1.4提供的DoumentBuilder和DocumentBuilderFactory组合可以对XML文件进行解析,转换成DOM文档。
w r*uv(B}D _
'D/y2d L)Z(E2xv )xsf1vkc3{;]:i8S
在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了DOMSource类和StreamSource类,可以用来将更新后的DOM文档写入生成的XML文件中。
!|6?!F6|;`0cgZM~!`-D 5v8Z1QAJ!K^]

x? aK!J,f:G gPm 4. 例程 hnuw$n i q

m5F3U&b7s*|
I0pn(P(w ['L 4.1 将XML文件转化成DOM文档
.cJ%GUCQ 8oR&pv8cD;O*f&kK%~

|R7kS5x-CM 这个过程是获得一个XML文件解析器,解析XML文件转化成DOM文档的过程。
He%T ? n8L Xn9W1|i)Y/O
J&y$x.J-o&L
Jdk1.4中,Document接口描述了对应于整个XML文件的文档树,提供了对文档数据的访问,是该步骤的目标。Document接口可以从类DocumentBuilder中获取,该类包含了从XML文档获得DOM文档实例的API。XML的解析器可以从类DocumentBuilderFactory中获取。在jdk1.4中,XML文件转化成DOM文档可以有如下代码实现: T0|,{ p.Gp]u

YqY"j(v@9M:m
%pS3qg#[-\C //获得一个XML文件的解析器 F.l6e-Ik y
!q6`1q }6\

{y|n+UY6ou{2JB~ DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
.\~6Q4TYJ p%o$l
X:tx}3b)v //解析XML文件生成DOM文档的接口类,以便访问DOM。
za%TGXM B,j&I
Wy.Bq Dr
U]3BG.Dw DocumentBuilder builder = factory.newDocumentBuilder();
xVB-Q HX0N
$cz3Y q\ document = builder.parse( new File(FileName) );
+z-z,QZ de _
vGF2Q-uC n,zu
rP;e@/cC 4.2 遍历DOM文档 7C:X5{A3@/v
K+n+o Js(n S!d-p

B"p4_M)^e1x z2\ 获得接口类document实例后,可以对DOM的文档树进行访问。要遍历DOM文档,首先要获得Root元素。然后获得Root元素的子节点列表。这里通过递归的方法实现遍历的目的。
:fml.Ik5X;EG$R cc%I }!\/oZ J rfU
%po@^m\P9zMc
//获得Root元素 _4ne{v6p \

(F#F9E$p{W3Or L;IB;p ^|
Element element = document.getDocumentElement(); ^ b*v EK#yN6P

8PkDd+yVhD
;hP4^(C2s$ty6{ //获得Root元素的子节点列表
1e:C0cp+XH%r4Z
FgyR,hk{\
Xs:W2aU nodelist = element.getChildNodes(); BSLPx7S6o

vQ&i9| a_ Dmx&E k3~b-]0QUf)D&L
//用递归方法实现DOM文档的遍历

麦迪 发表于 2008-6-12 06:53

GetElement(nodelist); 8wR+ta }:Y+`S@

g'F6UVf0g"pb :uI-G0eM#VO9s!u];n"U
6ns.v:q$wz
其中GetElement方法实现如下:
'k"W7`,[{L] /J+IZ6VlS6G/@P[

VQ dp*N&G
|M2Fy;_$UB4E f   public void GetElement(NodeList nodelist){
1Y4|8B(\V"g   Node cnode;$R4U+k9l `BV"@~c
  int i,len;U#o0~5Ug2@/{*D~
  String str;/\ @ HY2E It
  if(nodelist.getLength() == 0);e CfDO"YB
  // 该节点没有子节点
3R%L1T$Yqa+] ;cOE7|8Szm,N7Z]#E
  return;
-mjEP4U wJY   }V9Q])t"{N7X
  for(i=0;i 1)
m+P%rPCq.@   System.out.println(" "+str+" "+len);2?TF'N,HTw
  }
^!j X,b?   }
qZ7r oT!vcF W   }
-I)v~T wO4_TUCk
IVdLu ZQ8SSQY&w3~8el
tCSw%az_
注意:上面的代码只是显示Node类型和Text类型的对象。它们的类型标识分别是1和3。 !H]'E}KTN{3Q
:?%~^7lOt M D

ub2gz0Tm 4.3 修改DOM文档
(nBd'k%[waT,T4` Le.fKJ/mD
%tA{;C"C
修改DOM文档的API在DOM level 2 Core规范中做了说明,jkd1.4中的org.xml.dom中实现了这些API。修改DOM文档操作主要集中在Document、Element、Node、Text等类中,这里给出的例子中是在解析出的DOM文档中增加一系列对象,对应与在XML文件中增加一条记录。 VY {h6r*S3u
p.}T*~|

+^{c/p7L:d!a P // 获得Root对象 ky2a OO9?0u*M
0g%Xbf q(Iy

,q?*U(bB8VKQ g Element root = document.getDocumentElement(); 2uoZfc*By*S

Am#J'I-b@"Q,o // 在DOM文档中增加一个Element节点
l \;] c l&Dj;LY
#V.m&oc6wS
Fih0WGv| Element booktype = document.createElement("COMPUTES");
;f#xX5]@3n
)qmu3WOg xM6h //将该节点转化成root对象的子节点 u2qh1i(ggY3P'@ x
~:`H Y([,@ D'j
v C s'pT
root.appendChild(cdrom); \#o'a0q0y6[/f
],Q BT'pU
//在DOM文档中增加一个Element节点 g'WuR*? NL
PJ0`f;`P7Fx

AW#E T,bU Element booktitle = document.createElement("Title");
}0mV(o4B
)IS }3U y|8Mv$T~ //将该节点转化成booktype对象的子节点
H/l[,Xw*kam
"l { qnZ2m7?Tb n4J#LEri&?.Z-p
booktype.appendChild(booktitle); RL*p9U(d4XY

q9`4iyK7` //在DOM文档中增加一个Text节点
_M vyJ I
E:gg1Y S-iC ']FS;U7j N r6d'Y
Text bookname = document.createTextNode("understand Corba");
r\$f%gbe +z~M$e'Ml
//将该节点转化成bookname对象的子节点 j;w7E1T1Bm

0]L5`Oa*}+nF'Cu 5b]!@"CP-{{/Yg
booktitle.appendChild(bookname);
!z/J F"k*Q7^ .t4S-Y1Mn!N _P!^
u|SGK
4.4 将DOM文档转化成XML文件 J~j*ro.W
)rBG-j a;XT:|W
W]3U"q7K
// 获得将DOM文档转化为XML文件的转换器,在jdk1.4中,有类TransformerFactory
j5M/`R+Ga'P
u tigS9X*Qeo // 来实现,类Transformer实现转化API。 ;CYW/j1\]C

L;mO`S^"yJ^G2e:q
0~4?'z%Sp7K.s TransformerFactory tfactory = TransformerFactory.newInstance();
,B$]w*fg ~:y!cI Np N N6DProM
Transformer transformer = tfactory.newTransformer();
MI@mSK!h.K6e 3Pg!S0p`fY9p
// 将DOM对象转化为DOMSource类对象,该对象表现为转化成别的表达形式的信息容器。 MVm!@ j:q

V fW)OIF4g+P ^$e
i6p3q-K-j,f,@o9h DOMSource source = new DOMSource(document);
o/x%Z.D6^*Ns8x{jD`
:U:A2w&p*NJk b /* 获得一个StreamResult类对象,该对象是DOM文档转化成的其他形式的文档的容器,
)DP)~4|2A4_ n6Nk"\\y z
可以是XML文件,文本文件,HTML文件。这里为一个XML文件。*/
2Vhj0m4Op~$Gg7Y *sXU'D\;gtK7jD
StreamResult result = new StreamResult(new File(“text.xml”)); %jN^?|

&~XW?M^G } // 调用API,将DOM文档转化成XML文件。
z!T]9xGu,\3n6S#l*f Wb kjZJ

1RA-ass6gV.wE transformer.transform(source,result); 1LhDKyG u
&Jo7o.k1B,sQ\
iU qc/J/j:V K
这里提供了该例程的完整程序,该例程在windows 2000中jdk1.4环境中运行通过。 0p1`"Ir9f%`#@k
nzxN8N(Z QQ"|1~9tM
G&O0s\Rf1uk L
以上给出了一个例子,读者可以从中了解到对DOM操作的思路。因为对DOM的操作均遵循了DOM规范,所以也适用于其它语言对DOM的处理。

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.