基于Hadoop的固网宽带终端识别技术研究和实现
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1673-629X.2017.11.037

基于Hadoop的固网宽带终端识别技术研究和实现

引用
随着大数据时代的来临,大数据在各个行业应用越来越广泛.大数据在运营商行业的应用也很普遍,但同时也遇到了很多技术问题,其中家庭画像的塑造是运营商大数据的一个核心问题.如何提取和识别固网宽带下的终端类型是一个有待解决的问题.不像移动网,固网宽带由于没有信令通道,所以不携带任何准确的终端信息,因而对固网下的终端类型识别比较困难.传统方法都是采用解析和匹配HTTP GET报文中的UA字段进行识别.但这种方法由于UA的非标准化,以及终端数量和种类众多的缘故而导致终端类型的识别准确率低下.文中采用Hadoop框架,利用Hive中UDF的方法,结合分布式爬虫获取终端库,可以更加快速准确地识别出用户上网终端信息.实验结果表明,终端识别准确率可以达到92%以上,相比传统方法有了大幅提升.

终端识别、Hadoop、UserDefinedFunction(UDF)、分布式爬虫、固网宽带、大数据运营

27

TP31(计算技术、计算机技术)

2015江苏省产学研前瞻性联合研究项目BY2015011-02

2017-12-11(万方平台首次上网日期,不代表论文的发表时间)

共5页

171-175

相关文献
评论
暂无封面信息
查看本期封面目录

计算机技术与发展

1673-629X

61-1450/TP

27

2017,27(11)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn