XML Xerces Memo
XML 文書の構造分析 (parsing) を行うために,XML プロセッサの一つである Apache Xerces (Java2版) を Windows へインストールし,使用するためのメモ.
構造解析 (parsing) とは,XML 文書を読み込んで,アプリケーションに渡すための情報を取り出す 処理のこと.XML プロセッサ (XML パーサ)により行われる.
::目次::
XML プロセッサ (XML パーサ) について
XML プロセッサは主に次の二つに分けられる.
- 検証を行う XML プロセッサ:XML 1.0仕様で定義された妥当性制約(validity constraints)と 整形式制約(well-formedness constraints)をチェックする.
- 検証を行わない XML プロセッサ:整形式制約だけをチェックする.
Xerces のインストール
Xerces をインストールする前に,Java 2 SDK のバージョン1.2以降をインストールする必要がある.
Java 2 SDK の最新版は,Sun の Web サイト
からダウンロードできる.
インストール方法は Sun の Web サイトに詳しく書かれているので略.
ここでは,Java 2 SDK のインストールフォルダは
C:\j2sdk
とする.
次に Apache XML Project の Xerces Java 2 のダウンロードページ より Xerces-J のバイナリ (現在の最新バージョンは Xerces-J-bin.2.6.2.zip) を取ってくる.
zip ファイルを次のフォルダに展開する.
C:\xerces
最後に環境変数 CLASSPATH に次のパスとカレントディレクトリ(.)を追加する.
C:\xerces\xercesImpl.jar C:\xerces\xercesSamples.jar
設定例:set CLASSPATH=.;C:\xerces\xercesImpl.jar;C:\xerces\xercesSamples.jar
無事にインストールできたかどうかを確認するために,コマンドプロンプトで次のように入力する.
> cd c:\xerces > java sax.Counter data/personal.xml data\personal.xml: 62 ms (37 elems, 18 attrs, 140 spaces, 128 chars)
上のように,xml 文書中に含まれている要素数や属性数などを表示できれば OK.
もし,
Exception in thread "main" java.lang.NoClassDefFoundError: sax/Counter
のようなエラーが出た場合,CLASSPATH が正しく設定されていない可能性あり.
CLASSPATH の設定の確認方法は,コマンドプロンプトで,
> set CLASSPATH
と打ち込んで,
CLASSPATH=.;C:\xerces\xercesImpl.jar;C:\xerces\xercesSamples.jar
と返ってくるかどうかを確認する.
整形式 xml 文書の解析
未