10.11959/j.issn.1000-0801.2016317
随机森林在运营商大数据补全中的应用
电信运营商有大量数据,但是鉴于多种原因,数据的质量不够理想,出现大量数据不完整甚至缺失.对于已有数据的挖掘,必须在数据满足质量要求且达到足够采样比例的前提下开展.依托现有的全国日志留存系统,设计完整数据的模板样库,鉴别不能满足质量要求的数据,使用随机森林算法,找到最符合的相同或相关数据,补全数据并提升数据质量;用回溯反馈的方法优化并扩充模板样库.在全国日志留存系统中构建数据补全子系统,实现端到端的数据质量保障和提升,补全并改善历史数据甚至实时数据的质量,最终满足数据处理和挖掘的要求,提升运营商数据质量和价值.
大数据、随机森林、机器学习、数据补全
32
TN919.5
2017-01-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
7-12