网页编程必看:XML文法分析

首页 > XML

网页编程必看:XML文法分析

51自学网 http://www.wanshiok.com

　　分析XML文法需要构造一个下推自动机，它的结构定义如下：

　　1）STACK_DFA mata_xml_doc = <Q,Σ，σ，q,Γ,T,S >
　　Q: {…} /*详见后面的状态集合*/
　　Σ: /*指向待解析的XML元素词串*/
　　σ: Q×Σ->Q /*状态转移函数，见状态转移列表*/
　　q: {NIL_SKIP} /*初始状态*/
　　Γ: {NIL_FAILED,NIL_SUCCEED} /*终结状态集合*/
　　S: {Q/*状态*/, N/*DOM节点*/>,<…>} /*下推栈*/
　　2）栈顶符集合用于反映当前分析节点的类型：
　　T：{NIL/*空*/, TG/*标记*/, NS/*元素*/, IS/*指令*/, DS/*声明*/, CD/*CDATA界段*/,CM/*注释*/}
　　3）状态集合反映了分析的某一阶段特征，与栈顶符对应：
　　NIL: NIL_FAILED /*失败*/
　　NIL_SKIP /*忽略*/
　　NIL_SUCCEED /*成功*/
　　CM: CM_BEGIN /*注释开始*/
　　CM_END /*注释结束*/
　　TG: TG_OPEN /*标记打开*/
　　TG_INT_CLOSE /*标记中断*/
　　TG_PRE_CLOSE /*标记准备关闭*/
　　TG_CLOSE /*标记关闭*/
　　NS: NS_NAME_BEGIN /*元素名开始*/
　　NS_NAME_END /*元素名结束*/
　　NS_KEY_BEGIN /*属性名开始*/
　　NS_KEY_END /*属性名结束*/
　　NS_ASIGN /*属性赋值*/
　　NS_VAL_BEGIN /*属性值开始*/
　　NS_VAL_END /*属性值结束*/
　　NS_TEXT_BEGIN /*元素文本开始*/
　　NS_TEXT_END /*元素文本结束*/
　　IS: IS_OPEN /*指令打开*/
　　IS_NAME_BEGIN /*指令名开始*/
　　IS_NAME_END /*指令名结束*/
　　IS_KEY_BEGIN /*指令键开始*/
　　IS_KEY_END /*指令键结束*/
　　IS_ASIGN /*赋值符*/
　　IS_VAL_BEGIN /*指令值开始*/
　　IS_VAL_END /*指令值结束*/
　　IS_CLOSE /*指令关闭*/
　　DS: DS_OPEN /*声明打开*/
　　DS_SKIP /*越过申明节*/
　　DS_CLOSE /*声明关闭*/
　　CD: CD_BEGIN /*CDATA界段开始*/
　　CD_END /*CDATA界段结束*/

2/2 首页上一页 1 2

上一篇：XML的四种解析器原理及性能比较下一篇：XML 中的常见问题 (一)