8.3.1 SAX分析器接口简介
   

由前面介绍可知,SAX是一种事件驱动的接口,它的基本原理是由接口的用户提供符合定义的处理器,XML分析时遇到特定的事件,就去调用处理器中特定事件的处理函数。一般SAX接口都是用JAVA实现的,但事实上C++也可以用于实现SAX接口,只是C++的分析器比较少。之所以叫做"简单"应用程序接口,是因为这个接口确实非常简单,绝大多数事情分析器都没有做,需要应用程序自己去实现,因而开发者的任务也相应重一些。

SAX分析器的大体构成框架如图所示:

TU000000-0803-0100-01.gif (12065 bytes)

图中最上方的SAXParserFactory用来生成一个分析器实例。XML文档是从左侧箭头所示处读入,当分析器对文档进行分析时,就会触发在DocumentHandler,ErrorHandler,DTDHandler以及EntityResolver接口中定义的回调方法。

下面我们就对SAX分析器中的几个主要API接口作一简单的介绍。

  • SAXParserFactory

SAXParserFactory对象用来按照系统属性中的定义创建一个分析器的实例,接口是Javax.xml.parser. SAXParserFactory。

  • Parser

org.xml.sax.Parser接口定义了类似setDocumentHandler的方法来创建事件处理函数。另外,该接口中还定义了parser(URL)方法来对XML文档进行实际的分析工作。

  • DocumentHandler

当分析器遇到XML文档中的标记时,就会激活该接口中的startDocument,endDocument,startElement以及endElement等方法。另外,characters方法以及processingInstruction方法也是在DocumentHandler接口中实现的。当分析器遇到元素内部的文本内容时就会激活characters方法,当分析器遇到处理指令时就会激活processingInstruction方法。

  • ErrorHandler

当分析器在分析过程中遇到不同的错误时,ErrorHandler接口中的error、fatalError或者warning方法就会被激活。

  • DTDHandler

当处理DTD中的定义时,就会调用该接口中的方法。

  • EntityResolver

当分析器要识别由URI定义的数据时,就会调用该接口中的resolveEntity方法。

一个典型的SAX应用程序至少要提供一个DocumentHandler接口。一个健壮的SAX应用程序还应该提供ErrorHandler接口。