10.3969/j.issn.1000-3428.2011.21.016
基于LDA主题模型的软件缺陷分派方法
传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空问维度高、数据稀疏且包含噪音等问题,分派准确率较低.为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派.实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高.
软件缺陷分派、隐含狄利克雷分配模型、马尔可夫链蒙特卡洛方法、吉布斯采样、文本分类、向量空间模型
37
TP311(计算技术、计算机技术)
国家自然科学基金资助项目60873040
2012-03-16(万方平台首次上网日期,不代表论文的发表时间)
共3页
46-48