整合Dmoz和Yahoo标签的BNF文法及其实现
Dmoz和YahOO的标签采用不同的文法.为了统一它们的文法以利于搜索引擎的检索,对它们的标签结构进行了分析,统计出了相关的数据,并根据这些数据得出分别用于描述这两种标签结构的BNF(Backus-Naur Form)文法,然后将这两个BNF文法整合成一个,并应用JavaCC(Java Compiler Compiler)实现了对该文法的检测.在这个BNF文法的指导下,程序能够有效地判断一个标签模式是否满足Dmoz和Yahoo标签文法,为Web挖掘提供了良好的检测工具.
自然语言处理、巴克斯范式、文法、网络挖掘、文档分类
30
TP391.1(计算技术、计算机技术)
国家自然科学基金项目60673023、10872077;国家863高技术研究发展计划基金项目2007AA04Z114;广东省教育部产学研合作基金项目20078090400031;欧盟国际合作基金项目TH/Asia Link/010111084;吉林省科技发展计划基金项目20080708
2009-11-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
4520-4523