规则与规则库信息量的度量及其应用
将规则的信息量分为内交互信息和外传递信息.指出以往基于信息熵的规则客观兴趣度实际上都是内交互信息,体现的是规则前、后件间的交互信息及规则的可信度,而忽略了规则传递给用户的决策信息,即外传递信息.文中侧重于规则的客观外传递信息,指出分类规则的本质是从输入论域到输出论域的二元关系,并基于关系的信息熵及无偏原则,定义并度量了规则与规则库的(客观外传递)信息量.由于关系这一载体可很好地将规则及规则库、规则与先验知识联系起来,因此,进一步提出了规则及规则库的条件信息量、规则及规则库的相互独立性、规则库中的不一致知识等全新的概念及其度量公式.此外,对所提出度量的性质进行了讨论,得到了规则库的信息量可能小于规则库中各规则的信息量之和,及规则的条件信息量可能为负等重要结论.最后,对规则的信息量、规则库的信息量及规则的条件信息量的应用进行了讨论.提出了对规则获取算法进行评价的新方法,及规则库约简算法λ-Choice和RPCIC.
规则的有趣度、规则的信息量、规则库的信息量、规则库的条件信息量、规则的独立性、规则获取算法评价、规则库约简
39
TP3(计算技术、计算机技术)
国家自然科学基金;北京市自然科学基金;国家重点基础研究发展计划(973计划)
2009-05-22(万方平台首次上网日期,不代表论文的发表时间)
共16页
218-233