基于Python的美食数据爬取及可视化研究
本文主要研究中国菜谱里面的美食词汇资源的爬取、构建、数据处理并对词汇资源进行数据可视化分析.本文首先采用Python语言使用Scrapy框架进行数据爬取并对目标网站的网页进行页面分析,采集的是豆果美食网里最新发布的中国菜系菜谱,然后用Pandas、Numpy等库进行清洗数据并做可视化分析.除此之外,用Pyecharts库制作各大菜系菜品量的饼状图.最后通过Jieba库进行中文分词处理,筛选出高频词汇并制作了词云图.为了使乏味的文本数据散发活力,深入分析数据,以词云图展示数据分析的结果,增加数据可视化.
美食词汇、Python、网络爬虫、数据分析、词云图
17
TP391(计算技术、计算机技术)
国家自然科学基金;新疆维吾尔自治区社会科学基金;国家语言资源监测与研究中心少数民族语言分中心项目;新疆维吾尔自治区自然科学基金;新疆维吾尔自治区青年科技创新人才培养工程
2021-05-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
19-20,29