石油化工高等学校学报

石油化工高等学校学报 ›› 2007, Vol. 20 ›› Issue (1): 94-98.

• 计算机与自动化 • 上一篇    

基于单个XML文档结构的数据挖掘

梅东霞1,2, 张晓明2   

  1. 1.北京化工大学,北京100029; 2.北京石油化工学院,北京102617
  • 出版日期:2007-03-20 发布日期:2017-06-28
  • 作者简介:梅东霞(1979-),女,河北张家口市,在读硕士。
  • 基金资助:
    北京市教育委员会科技发展计划面上项目
    (KM200510017006)。

Data Mining Techniques for Structure of Single XML Document 

MEI Dong-xia1,2, ZHANG Xiao-ming2   

  1.  
    1.Beijing University of Chemical Technology, Beijing 100029,P.R.China; 
    2.Beijing Institute of Petro-Chemical Technology, Beijing 102617,P.R.China
  • Published:2007-03-20 Online:2017-06-28

摘要: 提出了一种基于XML的结构进行数据挖掘的算法,该方法使用现有的XML解析工具JAVADOM对XML文件进行解析,形成XML文档树,把XML中的标签按照层次作为标记路径存储起来,再对标记路径进行关联规则挖掘,得到频繁事务。通过实验表明,只有当XML的结构呈不规则时,挖掘效率才会随最小支持度的增大而提高。

关键词: XML文档 , 标记路径 , 关联规则 , 数据挖掘 , 频繁事务

Abstract: An algorithm based on structure of XML was proposed. XML was parsed using JAVA DOM in order to get XML document tree. The label of XML was stored as label path. Then, frequent transactions were obtained through mining association rules on label paths. The results show that if only the structure of XML is anomaly, the efficiency will be improved when minimal support is increased.

Key words: XML document ,  , Path label ,  Association rules , Data mining , Frequent transaction

引用本文

梅东霞, 张晓明. 基于单个XML文档结构的数据挖掘[J]. 石油化工高等学校学报, 2007, 20(1): 94-98.

MEI Dong-xia, ZHANG Xiao-ming. Data Mining Techniques for Structure of Single XML Document [J]. Journal of Petrochemical Universities, 2007, 20(1): 94-98.

使用本文

0
    /   /   推荐

导出引用管理器 EndNote|Ris|BibTeX

链接本文: http://journal.lnpu.edu.cn/syhg/CN/

               http://journal.lnpu.edu.cn/syhg/CN/Y2007/V20/I1/94