10.3321/j.issn:0254-4164.2004.04.018
基于潜在语义分析的BBS文档Bayes鉴别器
电子公告栏(BBS)的滥用是一种以信息污染为特色的社会问题,对BBS文档进行鉴别已成为信息安全重要内容之一.该文融合了数据挖掘技术、数理统计技术和自然语言理解技术,提出了基于潜在语义分析与Bayes分类的BBS文档鉴别方法:利用自然语言处理技术从训练文档中抽取典型短语集;通过潜在语义分析进行典型短语同义归约,应用关联规则采掘技术提高典型短语间的独立性;用Bayes分类器对BBS文档进行鉴别.该文还对影响系统的关键参数进行了大量的讨论和测试,实验表明该方法对于BBS文档的鉴别是可行而有效的.
数据挖掘、关联规则、Bayes分类、潜在语义分析、BBS
27
TP311(计算技术、计算机技术)
国家自然科学基金60073046;高等学校博士学科点专项科研项目20020610007
2004-05-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
566-572