10.3321/j.issn:0254-4164.2002.12.019
基于项目属性的相联规则提取
相联规则是数据库知识发现领域的重要方法之一,用于发现满足用户指定最小支持度和最小信任度阈值的规则.其中,最小支持度阈值确定了研究数据集的规模,最小信任度阈值用来衡量一个规则可靠性.在通常的支持度/信任度框架下,用户只能给出一对最小支持度和最小信任度阈值,因此,对于所有数据项均采用统一标准处理.但是,实际数据库中的数据项目具有各自的特点,该文旨在根据项目的属性特征,通过模糊综合评判,决定项目合理的最小支持度阈值,进而确定各个项目的支持度区间,达到在一次数据挖掘中同时发现频繁规则和稀有规则的目的.由于基于最小信任度的规则提取具有冗余性,文中提出规则前件和后件的重要程度对比的思想,借助主观判断去除冗余规则,从而挖掘出尽可能接近自然的完全规则.
相联规则、重要度、频度、对比度、支持度区间
25
TP393(计算技术、计算机技术)
国家自然科学基金69873019;吉林省自然科学基金19990528
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
1421-1427