블로그 이미지

카테고리

데꾸벅 (194)
Publisher (39)
HTML/HTML5 (4)
XML/XHTML (2)
CSS (22)
WEB2.0 (8)
XForms (3)
Scripter (97)
Programmer (1)
Designer (30)
Integrator (18)
Pattern Searcher (4)
News (2)
강좌 및 번역 (3)

최근에 올라온 글

최근에 달린 댓글

'Publisher/XML/XHTML'에 해당되는 글 2건

  1. 2008.04.15 XPATH 가이드
  2. 2008.04.15 XML 메소드와 속성 및 특성

XPATH 가이드

Publisher/XML/XHTML / 2008. 4. 15. 12:48


Xpath는 XML DOM문서의 내용을 조회하는데 있어서 일관적이고 빠른 방법을 제공한다. 하지만, 사용하는 방법에 따라 성능상의 차이가 나타날 수 있다. 이 글은 JavaScript에서 Xpath를 활용하는데 있어 방법에 따른 성능의 차이를 보이고, 보다 효과적으로 XML DOM 문서 다루는 방법을 설명한다.


Xpath사용시 흔한 잘못

Xpath는 XML DOM(Document Object Model) 문서에서 특정 조건을 만족하는 노드를 찾는 표준적인 방법을 제공한다. 보통 하나의 노드를 찾고, 다시 부모를 찾거나 혹은 얻어진 값으로 다시 다른 Xpath 쿼리를 작성하는 경우가 많다. selectSingleNode() 혹은 selectNodes()등을 자주 호출하여 성능이 저하되고, 작성된 코드도 길어진다. Xpath의 조건을 잘 이용하면, 여러 번에 나누어 조회하지 않고 한번에 원하는 노드를 찾을 수 있는 경우가 많다.

<?xml version="1.0" encoding="euc-kr"?>

<Message xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

  <Header/>

  <Body Desc="고객조회">

    <LastName></LastName>

    <FirstName>철수</FirstName>

    <SSN>701202-1111111</SSN>

    <Rgn>02</Rgn>

    <Age/>

    <JobCode/>

    <Sex/>

    <CrdtRate Code="C10">

      <Lov Code="C40" Desc="프리미엄"/>

      <Lov Code="C30" Desc="최우수"/>

      <Lov Code="C20" Desc="우수고객"/>

      <Lov Code="C10" Desc="단골고객"/>

    </CrdtRate>

    <Child SSN="001202-2024433"/>

    <Family>

      <LastName></LastName>

      <FirstName>영희</FirstName>

      <SSN>701202-2111111</SSN>

      <Sex>2</Sex>

      <RelCode>03</RelCode>

    </Family>

    <Family>

      <LastName></LastName>

      <FirstName>란아</FirstName>

      <SSN>001202-1111111</SSN>

      <Sex>1</Sex>

      <RelCode>04</RelCode>

    </Family>

  </Body>

</Message>

[예제 XML. sample_message.xml]

위의 XML 문서는 예제를 위한 테스트 문서 이다. 조회의 조건과 결과로 얻고 싶은 노드를 잘 구분하는 것이 좋다. 다음 세 개의 Xpath 문장은 비슷하지만, 리턴 하는 노드가 다르다.

/Message/Body/Family/SSN[.="001202-2024433"] // SSN 노드를 리턴 
/Message/Body/Family[SSN="001202-2024433"]   // Family 노드를 리턴 
/Message/Body[Family/SSN="001202-2024433"]   // Body 노드를 리턴

XML 문서가 가진 노드의 특정한 값을 찾고, 그 값으로 다른 노드를 검색하고자 하는 경우가 있다. 예를 들어, 위 XML 문서에서 /Message/Body/Child 의 SSN(주민번호)가 Family/SSN 값과 같은 Family 노드를 찾고자 한다면, 다음과 같이 쿼리를 작성할 수 있다.

/Message/Body/Family[SSN=string(/Message/Body/Child/@SSN)]

이와 같이 쿼리를 잘 작성하면 두 번 이상 조회를 한번에 하도록 할 수 있다. 다음 예는 의도적으로 selectNodes()를 사용하여 두개의 노드를 한번에 얻도록 쿼리를 작성한 것이다. /Message/Body/Child 노드의 SSN(주민번호)값과 같은 SSN 속성을 가지는 Family노드를 찾아 LastName과 FirstName 노드의 text를 얻는 코드이다. (xpath_01.htm 참조)

var xpath = '/Message/Body/Family[SSN
=string(/Message/Body/Child/@SSN)]/LastName
| /Message/Body/Family[SSN=string(/Message/Body/Child/@SSN)]
/FirstName';
var nodes = xmldoc.selectNodes(xpath); 
var name = nodes[0].text + nodes[1].text; 
alert(name);

Xpath 성능향상

Xpath 역시 쿼리조건을 기술하는 방법과 사용하는 방법에 따라 많은 성능의 차이를 보인다. 가장 좋은 방법은 쿼리 회수 자체를 줄이는 것이며, 두번째는 쿼리의 대상이 되는 범위를 줄이는 것이다. 다양한 비교를 통해 성능 향상을 위한 구체적인 방법을 살펴보자. 이 글에서 사용한 예제 XML은 아래의 [sample_message.xml]이다.

<?xml version="1.0" encoding="euc-kr"?>

<!-- sample xml -->

<message xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

 <header svr-time="20050505101023" ch="EnRich001" trans="E833CDF563EAC3" cli-time="20050101175941">

   <svc name="CustInfo" mtd="getEmno_1" resid="getEmno_1"/>

   <scr comp-id="Btn02" no="0321"/>

   <cli ip="10.15.56.56" mac="00-90-96-75-C4-79"/>

   <user name="홍길동" id="plusjune"/>

   <res err-code="000">정상</res>

   <curr-odr>1</curr-odr>

   <debug log-level="1" test="true"/>

   <sso-token>Vy3zFySSOx2DTESTzTyGIDx2D1zCy1120</sso-token>

 </header>

 <sub-header>

   <auth>0</auth>

   <emp-no>17874</emp-no>

   <name>김유신</name>

   <br-cd>868</br-cd>

   <br-name>고객사업부</br-name>

   <level>4</level>

   <pos-cd>314</pos-cd>

   <pos-name>과장</pos-name>

<!--중략 -->

   <cif>123456789</cif>

   <SSN/>

 </sub-header>

 <body>

   <result-set resid="cust_Info_select_detail_info">

     <res resid="cust_workcarrer" code="0" msg="">

       <rec rownum="1">

         <col name="emno" type="char">9102321</col>

         <col name="gaze_stymd" type="date"/>

         <col name="gaze_edymd" type="date"/>

         <col name="position" type="number"/>

         <col name="branch_1" type="char"/>

       </rec>

     </res>

     <res resid="cust_license" code="0" msg="">

       <rec rownum="1">

         <col name="emno" type="char">9102321</col>

         <col name="qual_nm" type="char"/>

         <col name="gain_ymd" type="date"/>

         <col name="iss_plac" type="char"/>

       </rec>

     </res>

     <res resid="cust_traning" code="0" msg="">

       <rec rownum="1">

         <col name="emno" type="char">9102321</col>

         <col name="trn_nm" type="char"/>

         <col name="mng_plac" type="char"/>

         <col name="stday" type="date"/>

         <col name="enday" type="date"/>

       </rec>

<!--중략 -->

     </res>

   </result-set>

   <result-set resid="product_info">

     <cust id="cust_selfvaluation1" code="0" msg="">

       <opt key="emno" type="char">9102321</opt>

       <opt key="yy" type="char">2005</opt>

       <opt key="hfy_clcd" type="char">1</opt>

       <opt key="branch_2" type="char"/>

       <opt key="apr_grp_nm" type="char"/>

       <opt key="rank" type="number"/>

     </cust>

<!--중략 -->

   </result-set>

 </body>

</message>


시간 측정을 위해 LapTime.js 클래스(첨부파일 참조)를 사용하였다.

성능향상 – ‘//’를 쓰지 말 것

‘//’로 시작하는 쿼리는 XML DOM전체를 full-scan하기 때문에 좋지 않은 성능을 보여준다. [sample01.js]의 예제는 ‘//’를 쓴 경우와 절대 경로를 쓴 경우를 비교하고 있다. [sample01.js]의 코드에서 각각의 함수는 다음과 같은 내용을 가지고 있다.

    1. f1() – ‘//’로 시작하는 쿼리를 사용하였다.
    2. f2() – 먼저 부모노드를 찾고 그 다음 하위노드를 찾아 비교하였다.
    3. f3() – 절대 경로를 사용하였다.

[sample01.js]

function f1()
{
  return xmldoc.selectSingleNode("//rec[@rownum='2']/col[@name='emno']").text;
}

function f2()
{
  var node = xmldoc.selectSingleNode("//rec[@rownum='2']");
  return node.selectSingleNode("col[@name='emno']").text;
}

function f3()
{
  var base_path = "/message/body/result-set/res";
  return xmldoc.selectSingleNode(base_path + "/rec[@rownum='2']/col[@name='emno']").text;
}


f1은 두 개의 조건을 한번에 사용하였고, f2()는 한 개의 조건에 해당하는 노드를 찾은뒤 다시 하위 노드에서 두번째 조건을 사용하였다. f3()는 절대경로를 사용하였다. [그림1]은 f1()~ f3()함수를 각각 10,000씩 수행하는데 걸린 수행 시간을 보여주고 있다.

사용자 삽입 이미지










[그림1 – sample01.js 결과]

결과적으로 ‘//’로 시작하는 쿼리보다 절대 경로를 사용한 쿼리가 빠르다는 것을 알 수 있다. 이 차이는 XML DOM 문서가 크면 클수록 차이가 크게 생긴다.

성능향상 - 쿼리대상의 범위를 줄일 것

절대 경로를 사용하더라도 사용하는 횟수가 많으면 좋지 않은 성능을 가져올 수 있다. 매번 절대경로를 사용하는 것보다, 조회할 하위 노드 부분이 정해지면 상위 노드를 한번 찾아놓고, 하위 노드를 찾는 방식이 빠르다. 또한 특정 범위의 상위 노드를 처음 참조할 때 한번 찾아놓고, 다음 부터는 찾아놓은 노드를 활용하는 것도 성능 향상을 위해 좋은 방법이 될 수 있다.





[sample02.js]

function header1()
{
  var result_text = '';
 
  result_text += "name=" + xmldoc.selectSingleNode("/message/header/svc/@name").nodeValue + ",";
  result_text += "mtd=" + xmldoc.selectSingleNode("/message/header/svc/@mtd").nodeValue + ",";
  result_text += "resid=" + xmldoc.selectSingleNode("/message/header/svc/@resid").nodeValue + ",";

  return result_text;
}

function header2()
{
  var result_text = '';
  var attrs = xmldoc.selectSingleNode("/message/header/svc").attributes;
  result_text += "name=" + attrs.getNamedItem("name").nodeValue + ",";
  result_text += "mtd=" + attrs.getNamedItem("mtd").nodeValue + ",";
  result_text += "resid=" + attrs.getNamedItem("resid").nodeValue + ",";

  return result_text;
}

function header3()
{
  var result_text = '';
  if(header3.attrs == undefined)
    header3.attrs = xmldoc.selectSingleNode("/message/header/svc").attributes;
 
  result_text += "name=" + header3.attrs.getNamedItem("name").nodeValue + ",";
  result_text += "mtd=" + header3.attrs.getNamedItem("mtd").nodeValue + ",";
  result_text += "resid=" + header3.attrs.getNamedItem("resid").nodeValue + ",";

  return result_text;
}



[sample02.js]는 header1()과 header2(),header3() 함수로 구성되어 있다. header1()은 매번 절대 경로를 사용하여 속성값을 얻오는 것을 보여주고 있고, header2()함수는 부모 노드를 찾은 뒤 노드의 함수들을 이용하여 하위 노드(혹은 속성)값을 가져오는 방법을 보여준다.

header3()은 조금 더 진보한 방법을 사용하고 있다. 처음에 속성 노드를 찾아 놓고 JavaScript에 멤버를 추가하여 유지하도록 하는 방식(header3.attrs는 Java 혹은 C#의 static 멤버와 같다. 이와 관련하여 Object Oriented JavaScript (2)를 참조하라)을 사용하고 있다. 반복하여 호출하는 경우 즉, XML노드를 반복하여 참조하는 경우에 매우 유리하다. header1()과 header2(),header3() 함수의 수행속도를 비교한 결과는 아래 [그림2]와 같다.

사용자 삽입 이미지












[그림2 – sample01.js 결과]

성능향상 – 객체지향 JavaScript와 BOM 활용

JavaScript의 객체지향을 잘 이용하여 BOM(Business Object Model)을 생성하고 활용하면, 속도의 개선 뿐만 아니라 어플리케이션의 구성을 유지보수하기 좋은 형태로 구성할 수 있다. 앞서 이야기한 것과 같이 Xpath를 이용하여 XML DOM을 매번 조회하지 않고, 초기에 한번만 조회하도록 하였다. header1()과 header2()는 그러한 차이를 보여준다.

 
function header1(){
 this.getResultText = function _getResultText(){
  var result_text = '';
  var node = xmldoc.selectSingleNode("message/header/svc");
  result_text += "name=" + node.attributes.getNamedItem("name").nodeValue + ",";
  result_text += "mtd=" + node.attributes.getNamedItem("mtd").nodeValue + ",";
  result_text += "resid=" + node.attributes.getNamedItem("resid").nodeValue + ",";
 
  return result_text;
 }
}
function header2(){
 var result_text;
 this.update = function _update(){
  var node = xmldoc.selectSingleNode("message/header/svc");
  result_text += "name=" + node.attributes.getNamedItem("name").nodeValue + ",";
  result_text += "mtd=" + node.attributes.getNamedItem("mtd").nodeValue + ",";
  result_text += "resid=" + node.attributes.getNamedItem("resid").nodeValue + ",";
 }
 this.getResultText = function _getResultText(){
  if(result_text == undefined)
    this.update();
  return result_text;
 }
}


 

[sample03.js]

header2()는 두개의 멤버함수를 가지고 있다. getResultText()는 결과 값을 DOM으로부터 가져와 result_text에 기록하는 역할을 수행한다. 즉, DOM에 대한 Xpath 쿼리를 수행한다. 아래의 코드는 결과가 정의되어 있지 않을 때(undefined) Xpath 쿼리를 수행하도록 하고 있다.

if(result_text == undefined) this.update();

update() 멤버함수는 필요에 따라 호출될 수 있다. (예를 들어 XML DOM을 새로 읽었거나 변경된 경우). 이런 구성을 잘 활용하면, 속도의 증진 뿐만 아니라 복잡한 XML DOM과 템소를 Wrapping 하여 유지보수하기 좋고 이해하기 좋은 구성을 가지도록 코드를 작성할 수 있다. [그림3]은 반복하여 수행한 결과를 보여준다. (header2의 경우 Xpath 쿼리를 1회만 수행하므로, 반복적으로 Xpath 쿼리를 수행하는 header1에 비해 비교가 되지 않을 정도로 빠르다)

사용자 삽입 이미지












결론

Xpath 쿼리를 잘 작성하면, 여러 번에 나누어 쿼리하지 않아도 되므로 코드를 간결하게 유지할 수 있을 뿐만 아니라, 잦은 쿼리의 부하도 줄일 수 있다. XML DOM을 효과적으로 다루는 첫번째 방법은 쿼리회수 자체를 줄이는 것이고, 두번째는 검색 대상 범위를 줄이는 것이다. DOM 전체를 크게 몇 개의 논리적인 단위로 나누고, 각각의 상위 노드에 대한 참조를 가지고, 그 참조에 대해 Xpath 쿼리를 하는 것도 하나의 방법이다. 또한, BOM을 잘 구성하여 Xpath와 관련된 operation을 wrapping 함으로써, 속도의 개선뿐만 아니라 유지보수하기 좋도록 어플리케이션을 구성할 수 있다.


'Publisher > XML/XHTML' 카테고리의 다른 글

XML 메소드와 속성 및 특성  (0) 2008.04.15
Post by 넥스트리소프트 데꾸벅(techbug)
, |
하두 잘 까먹어서 꼬불쳐 두었던 글인데 네이버블로그에 있던글을 다시 포스팅한다



XML 생성

XML.appendChild() 메소드
지정된 객체의 자식 목록 끝에 노드 추가
XML.createElement() 메소드
새로운 XML 요소 생성
XML.createTextNode() 메소드
새로운 XML 텍스트 노드 생성
예)myXML = new XML();
node = myXML.createElement("주소록");
name = myXML.createElement("이름");
ntext = myXML.createTextNode("누군가");
name.appendChild(ntext);
node.appendChild(name);
tel = myXML.createElement("전화번호");
ttext = myXML.createTextNode("000-000-0000");
tel.appendChild(ttext);
node.appendChild(tel);
myXML.appendChild(node);
trace(myXML);

※ 결과:<주소록><이름>누군가<전화번호>000-000-0000

XML 복제

XML.cloneNode(true or false) 메소드
지정된 노드를 복제하고 선택 및 반복적으로 모든 자식 복제
true면 자식의 노드까지 복사되고 false면 노드만 복사
예) myXML = new XML();
node = myXML.createElement("주소록");
name = myXML.createElement("이름");
text = myXML.createTextNode("누군가");
name.appendChild(text);
node.appendChild(name);
myXML.appendChild(node);
trace(myXML);
copyXMLt = myXML.cloneNode(true);
copyXMLf = name.cloneNode(false);
trace(copyXMLt);
trace(copyXMLf);

※ 결과:<주소록><이름>누군가
<주소록><이름>누군가
<이름 />

XML 특정 노드의 존재 유뮤 확인

XML.hasChildNodes() 메소드
지정된 노드에 자식 노드 유무에 따라 True 및 False 반환
예) myXML = new XML();
node = myXML.createElement("주소록");
name = myXML.createElement("이름");
text = myXML.createTextNode("누군가");
name.appendChild(text);
node.appendChild(name);
myXML.appendChild(node);
trace(myXML);
if(myXML.hasChildNodes) {
trace("자식노드가 존재합니다");
} else {
trace("자식노드가 존재하지 않습니다");
}

※ 결과:<주소록><이름>누군가
자식노드가 존재합니다

XML 문서 해석

XML.parseXML(source) 메소드
XML 문서를 지정된 XML 객체 트리로 파싱
※ source는 문자열이며 source안에는 Spacebar, Tab, Enter가 들어가면 안된다.
예) myXML = new XML();
source = "<주소록><이름>누군가"
myXML.parseXML(source);
trace(myXML);

※ 결과:<주소록><이름>누군가

외부 XML문서 불러오기

XML.load("URL") 메소드()
URL의 XML 문서 로드 후 XML 계층 구조로 변환
XML.onLoad 이벤트 핸들러
load 및 sendAndLoad에 대한 지정된 함수(콜백 함수) 호출
예1)function loadEnd(){
trace(this);
}
myXML = new XML();
myXML.onLoad = loadEnd;
myXML.load("주소록.xml");

예2)myXML = new XML();
myXML.onLoad = function loadEnd() {
trace(this);
}
myXML.load("주소록.xml");


 XML 문서의 특정 노드 접근

XML.firstChild 속성
지정된 노드의 목록에서 첫번째 자식 노드 참조(읽기)
XML.lastChild 속성
지정된 노드의 목록에서 마지막 자식 노드 참조(읽기)
XML.nextSibling 속성
부모 노드의 자식 목록에서 다음 형제 노드 참조(읽기)
XML.previousSibling 속성
부모 노드의 자식 목록에서 이전 형제 노드 참조(읽기)
XML.parentNode 속성
지정된 노드의 부모 노드 참조(읽기)

XML.nodeName 속성
XML객체의 노드 이름을 가져오거나 반환(읽기/쓰기)
XML.nodeValue 속성
XML 객체의 노드 값(Value) 반환(읽기/쓰기)

XML.nodeType 속성
노드 값을 가져오거나 반환. 형태가 '노드'면 1, '텍스트'면 3 반환(읽기/쓰기)

XML 문서 속성 사용

XML.attributes 컬렉션
지정된 노드의 모든 속성을 포함하는 관련 배열 반환(읽기/쓰기)
예)myXML = new XML();
source = "<주소록 이름= '누군가' 전화번호='어딘가'>";
myXML.parseXML(source);

myXML.firstChild.attributes.이름 //참조
myXML.firstChild.attributes.전화번호="054-000-0000" //수정

XML.getBytesLoaded() 메소드
지정된 XML 문서용으로 로드된 바이트 수 반환

XML.getBytesTotal() 메소드
XML 문서의 크기를 바이트 수로 반환

XML.insertBefore() 메소드
지정된 노드의 자식 목록에서 기존 노드 앞에 노드 삽입

XML.removeNode() 메소드
지정된 노드를 부모에서 제거

XML.send() 메소드
지정된 XML 객체를 URL로 전송

XML.sendAndLoad() 메소드
지정된 XML 객체를 URL로 보내고
서버 응답을 다른 XML객체에 로드

XML.toString() 메소드
지정된 로드와 자식을 XML 텍스트로 변환
XML.contentType 속성
서버에 전송된 Mime 유형 표현(읽기/쓰기)

XML.docTypeDecl 속성
XML 문서의 Doctype 선언에 대한 정보 설정 및 반환(읽기/쓰기)

XML.ignoreWhite 속성
true로 설정되면
공백만 포함한 텍스트 노드는 파싱 과정에서 삭제(읽기/쓰기)

XML.loaded 속성
지정된 XML 객체가 로드되었는지 확인(읽기)

XML.status 속성
XML 문서 파싱 작업의 성공 또는 실패를 나타내는 숫자 상태 코드 반환(읽기)

XML.xmlDecl 속성
XML 문서의 문서 선언에 대한 정보 설정 및 반환(읽기/쓰기)
XML.childNodes 컬렉션
지정된 노드의 자식 노드를 배열 형식으로 참조 가능하게 만들어 줌(읽기)

XML.onData 이벤트 핸들러
서버에서 XML 텍스트를 완전히 로드한 경우 또는 다운로드할 때 오류가 발생한 경우 호출되는 콜백 함수

'Publisher > XML/XHTML' 카테고리의 다른 글

XPATH 가이드  (0) 2008.04.15
Post by 넥스트리소프트 데꾸벅(techbug)
, |