基于网络检索词频分析“百度知道”中公众对先天性出生缺陷相关信息的需求
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3760/cma.j.cn115624-20210310-00119

基于网络检索词频分析“百度知道”中公众对先天性出生缺陷相关信息的需求

引用
目的:基于网络检索词频分析“百度知道”中公众对先天性出生缺陷相关信息的需求。方法:由妇产科专家与流行病学专家讨论后,确定先天性出生缺陷相关检索词并制定检索策略,采用Python 2.7进行网络爬虫检索,在“百度知道”平台获得先天出生缺陷相关的提问句,再使用R 4.0.2软件进行文本数据处理,完成关键词的语义分析与词频统计分析,并绘制词云图和极坐标图来描述关键结果。结果:在“百度知道”平台中共检索到16 668条不重复的提问句,语义词词频数为15 371,其中,先天出生缺陷相关疾病名称与症状词频数占35.02%。此外,先天性心脏病相关词频构成比最高(26.09%)。出生缺陷检索词主题分析结果显示诊断和治疗语义词的平均词频数(49.55)明显高于病因及预防相关语义词平均词频数(12.47)。此外,检查、原因、治疗、发育、遗传等关键词在七类系统畸形相关语义词中的出现频率均较高。结论:我国公众对于先天性出生缺陷相关的疾病、及其病因、预防以及治疗方面的信息需求较高,其中尤以先天性心脏病在疾病相关词频中占比最高。

先天性出生缺陷、百度知道、网络爬虫、文本挖掘、词频分析

15

中国科技部国家重点研发计划专项资助课题2016YFC1000105;State Key Research and Development Plan of the Ministry of Science and Technology of the People′s Republic of China2016YFC1000105

2023-05-30(万方平台首次上网日期,不代表论文的发表时间)

共6页

237-242

相关文献
评论
暂无封面信息
查看本期封面目录

中华健康管理学杂志

1674-0815

11-5624/R

15

2021,15(3)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn