基于自动聚类算法(AutoClass)的恒星/星系分类
自动聚类算法(AutoClass)是一种非监督的能对复杂数据进行精确的自动聚类的有效分类方法,可以事先设定好类别数目让AutoClass自动寻找,在寻找结束后,能够得到每一条数据分别属于每一类别的几率,这样可以根据专业知识,选出比较好的分类效果.描述了使用AutoClass对SDSS DR6的恒星/星系测光数据进行分类,将868974条测光数据进行处理,通过去离群数据和自动聚类的方法,将最终的812613条数据分成两类,其中星系和恒星的数据分别是680361和126988条.对于去掉离群后的数据,星系和恒星的分类正确率分别达到99.51%和98.52%,表明AutoClass算法对去掉离群数据后的恒星/星系数据分类有很好的效率.因此,可以将该算法应用于天文中的其他分类问题,另外基于该算法的非监督性,可以帮助天文学家去掉离群数据或发现一些特殊天体.
恒星/星系、AutoClass、数据分析
39
P1(天文学)
国家自然科学基金10778724;10778616;国家高技术研究发展计划863计划2006AA01A120
2010-03-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
1794-1799