10.11896/j.issn.1002-137X.2014.09.008
一种基于主题建模的代码功能挖掘工具
代码复用是重要的软件复用方式之一,复用者需要理解软件代码实现的功能方能有效实施软件复用.基于主题建模技术的程序理解方法逐渐受到研究人员的重视,它能够帮助软件开发者和使用者更好地理解软件的功能.目前,基于主题建模技术的程序理解方法一般欠缺对挖掘出的Topic的语义分析,为此提出的基于代码静态分析和LDA技术的代码功能挖掘(Code Function Mining,CFM)方法可作为对这类方法的补充.CFM是一套以代码为研究对象的挖掘、筛选、组织和描述主题(Topic)的方法,该方法能够生成带描述的功能型Topic的层次结构,以供使用者更清晰和方便地浏览、学习软件的功能.功能型Topic的描述能够帮助复用者理解代码功能,其层次结构能够让复用者从不同抽象层次理解代码功能.CFM方法包括4个部分:挖掘Topic、筛选Topic、组织Topic、描述Topic.以CFM方法为基础,设计并实现了一个CFM工具.CFM工具能够分析用户提交的代码,通过Web页面向用户展示带描述的功能型Topic的层次结构.最后,对CFM方法中的几个关键算法进行实验分析,验证了CFM方法的有效性.
软件代码、代码静态分析、LDA、代码功能挖掘
41
TP301(计算技术、计算机技术)
国家高技术研究发展计划863计划2012AA01A403;国家自然科学基金61121063;国家重点基础研究发展计划973计划2009CB320703
2014-11-03(万方平台首次上网日期,不代表论文的发表时间)
共8页
52-59