抽取自媒体新闻热词的技术实现
通过基于Python语言的网络爬虫对"今日头条"、"一点资讯"的热点推送新闻标题进行抓取,使用基于Python的中文分词工具对新闻标题数据进行分词统计处理.为了高效获取数据,对不同的网站使用不同的爬虫技术,在为期一个月的时间内对"今日头条"等自媒体新闻网抓取近万条热点新闻标题,在对数据进行分词统计及关键词提取后成功获取当月新闻中的热词.
网络爬虫、中文分词、自媒体、新闻传播、关键词
14
TP311(计算技术、计算机技术)
上海立信会计金融学院大学生创新创业训练计划项目201711047008
2018-07-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
14-16,21