基于半监督模式的恒星光谱自动分类方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3964/j.issn.1000-0593(2023)06-1875-06

基于半监督模式的恒星光谱自动分类方法

引用
随着越来越多的大型光谱巡天计划的实施,产生了海量的恒星光谱数据,这对于恒星演化理论的研究具有重大意义,但也给传统的光谱分类和处理带来极大挑战.2021 年发布的 LAMOST DR7(v2.0 版本)光谱数据集中,恒星光谱总量为百万量级,但其中 O型星的数量仅为 129 条,远远小于其他六类恒星光谱数量.对于这种数据量大、数据集严重不平衡的情况,传统的机器学习分类方法达不到较好的效果,因此多用于对相邻两类、部分类或子类恒星光谱进行分类.针对以上问题,使用一维卷积神经网络(CNN)和一维生成对抗网络(GAN)相结合的半监督学习模式对七类恒星光谱进行全分类.实验首先对每条光谱进行裁剪和去噪,截取光谱波长范围为 370.00~867.16 nm部分,然后进行均匀采样和归一化,生成大小为 1×3700的数据集样本,送入CNN进行训练.为了避免过拟合并提高模型对未知数据的预测能力,在 CNN 的全连接层和池化层之间添加正则项Dropout.使用该网络对除O型星以外的六类光谱进行分类,平均分类准确率达到 98.08%.针对 O型星数量严重偏少的问题,采用 GAN 来扩充数据集.GAN 的输入是 1×900 大小的噪声信号,经过生成器中全连接的三层跨步卷积运算,输出大小为 1×3700 的数据.通过对生成器和判别器进行单独交替迭代训练使 GAN收敛,最终输出所需数量的 O型星样本,达到扩充数据集的目的.和常见的通过过采样扩充数据集相比,利用 GAN扩充数据集,结合一维 CNN 对恒星光谱进行全分类,可以将 O型星的分类准确率由 72.92%提升至 97.92%,整个分类器的准确率达到 96.28%.实验结果表明,使用这种半监督模式的恒星光谱自动分类方法可以实现对七类恒星光谱的快速、准确分类,也可以用于对标记为"Unknown"的未分类恒星光谱进行挖掘,达到充分利用光谱的目的.

恒星光谱、自动分类、卷积神经网络、生成对抗网络、半监督模式

43

P157.2(恒星天文学、星系天文学、宇宙学)

国家自然科学基金U1931134

2023-07-03(万方平台首次上网日期,不代表论文的发表时间)

共6页

1875-1880

相关文献
评论
暂无封面信息
查看本期封面目录

光谱学与光谱分析

1000-0593

11-2200/O4

43

2023,43(6)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn