10.3969/j.issn.1001-4683.2021.04.007
面向历史灾害地震的Web信息精确抽取与分析方法
以中国大陆地区灾害地震目录为基础,选取2010-2019年灾害地震的互联网信息,提出基于百度搜索引擎的信息获取技术,并以"时间、地名、震级"为关键词,设计一套URL生成规则.使用该技术进行百度检索,得到前100个站点的主体文字信息,建立地震信息基础语料库,形成灾害地震的网络灾情信息获取方法;通过采用已有的停用词词库剔除无用信息,对爬取到的信息进行初步清洗工作,进一步深入挖掘隐含信息,探索灾害关联关系,为震后互联网灾情信息快速获取建立基础.
灾害地震;Web信息抽取;灾情信息获取;数据分析
37
P315(大地(岩石界)物理学(固体地球物理学))
地震应急信息快速可视化技术研究资助2018YFC1504506
2022-02-25(万方平台首次上网日期,不代表论文的发表时间)
共10页
819-828