基于关联规则与相似度的数据挖掘算法研究

引用

摘要：

针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则.同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘.实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.

关键词：关联规则;频繁项集;相似度;数据挖掘

所属期刊栏目：53

分类号：TP301.6(计算技术、计算机技术)

资助基金：国家自然科学基金项目U1811263

在线出版日期：2021-11-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：121-127

英文信息展示

期刊专题