云计算平台上两种中文分词算法的实现对比研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

云计算平台上两种中文分词算法的实现对比研究

引用
现如今,常用的中文分词算法为IKAnalyzer(简称为:IK)和ICTCLAS(简称为:IC)两种,这两种算法也可以说是如今的主流中文分词算法,为了能够更好的研究两种算法的性能,本文首先利用理论对两种算法在单机环境下的性能进行分析,而后通过Hadoop分布式文件管理系统(简称为:HDFS)、Hadoop集群和并行处理大数据集的MapReduce所共同组成的系统框架,并将算法优化后,通过开展大量的实践性实验对两种不同算法在分布式环境下对大数据集进行处理后的表现进行比较,而后得出具体的分析结果,希望能够为相关人士带来帮助.

云计算、IKAnalyzer、ICTCLAS、Hadoop、比较

17

TP3(计算技术、计算机技术)

该文源自武汉船舶职业技术学院校内一般课题编号:2019y15

2021-04-19(万方平台首次上网日期,不代表论文的发表时间)

共2页

191-192

相关文献
评论
暂无封面信息
查看本期封面目录

电脑知识与技术

1009-3044

34-1205/TP

17

2021,17(9)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn