基于高斯 Copula 的约束贝叶斯网络分类器研究
具有连续属性的分类问题普遍存在,目前主要采用两种方法来处理连续属性:一种是将连续属性进行离散化;另一种是基于高斯函数或高斯核函数来估计属性密度。连续属性的离散化可能导致信息丢失、引入噪声和类对属性的变化不够敏感等问题,而高斯函数和高斯核函数在属性密度估计中各有优势与不足,但它们具有很强的互补性。该文依据 Copula 和贝叶斯网络理论,结合高斯 Copula 密度函数、引入平滑参数的高斯核函数和以分类准确性为标准的属性父结点贪婪选择,建立连续属性约束贝叶斯网络分类器,既可以避免连续属性离散化所带来的问题,又能够实现高斯函数和高斯核函数在属性密度估计方面的优势互补。分别采用真实数据和模拟数据进行实验,结果显示,使用结合边缘高斯核函数的高斯 Copula 估计属性密度的约束贝叶斯网络分类器具有良好的分类准确性。
贝叶斯网络分类器、连续属性、高斯 Copula、高斯核函数、平滑参数、机器学习
39
TP181(自动化基础理论)
国家自然科学基金61272209;上海市自然科学基金15ZR1429700;上海市教委科研创新项目15ZZ099资助.
2016-08-24(万方平台首次上网日期,不代表论文的发表时间)
共14页
1612-1625