XML Xerces Memo

XML 文書の構造分析 (parsing) を行うために,XML プロセッサの一つである Apache Xerces (Java2版) を Windows へインストールし,使用するためのメモ.

構造解析 (parsing) とは,XML 文書を読み込んで,アプリケーションに渡すための情報を取り出す 処理のこと.XML プロセッサ (XML パーサ)により行われる.

::目次::


XML プロセッサ (XML パーサ) について

XML プロセッサは主に次の二つに分けられる.

  • 検証を行う XML プロセッサ:XML 1.0仕様で定義された妥当性制約(validity constraints)と 整形式制約(well-formedness constraints)をチェックする.
  • 検証を行わない XML プロセッサ:整形式制約だけをチェックする.

Xerces のインストール

Xerces をインストールする前に,Java 2 SDK のバージョン1.2以降をインストールする必要がある.
Java 2 SDK の最新版は,Sun の Web サイト からダウンロードできる.
インストール方法は Sun の Web サイトに詳しく書かれているので略.
ここでは,Java 2 SDK のインストールフォルダは

C:\j2sdk

とする.

次に Apache XML ProjectXerces Java 2 のダウンロードページ より Xerces-J のバイナリ (現在の最新バージョンは Xerces-J-bin.2.6.2.zip) を取ってくる.
zip ファイルを次のフォルダに展開する.

C:\xerces

最後に環境変数 CLASSPATH に次のパスとカレントディレクトリ(.)を追加する.

C:\xerces\xercesImpl.jar
C:\xerces\xercesSamples.jar

設定例:set CLASSPATH=.;C:\xerces\xercesImpl.jar;C:\xerces\xercesSamples.jar

無事にインストールできたかどうかを確認するために,コマンドプロンプトで次のように入力する.

> cd c:\xerces
> java sax.Counter data/personal.xml
data\personal.xml: 62 ms (37 elems, 18 attrs, 140 spaces, 128 chars)

上のように,xml 文書中に含まれている要素数や属性数などを表示できれば OK.
もし,

Exception in thread "main" java.lang.NoClassDefFoundError: sax/Counter

のようなエラーが出た場合,CLASSPATH が正しく設定されていない可能性あり.
CLASSPATH の設定の確認方法は,コマンドプロンプトで,

> set CLASSPATH

と打ち込んで,

CLASSPATH=.;C:\xerces\xercesImpl.jar;C:\xerces\xercesSamples.jar

と返ってくるかどうかを確認する.


整形式 xml 文書の解析

Home

Tips

ページのトップへ戻る