基于词云图和层次聚类的天然产物研究热点分析
探索天然产物领域研究热点可以为新药研发、中医药、植物学等多个领域的研究人员指引研究方向.本研究首先利用爬虫从PubMed数据库采集了2019年以来10个天然产物权威杂志刊载的所有文献信息,数据清洗后得到2 278篇文献、8 539个关键词;之后利用Python编程统计词频,对Top100的高频词进行同义词合并处理,得到77个高频词并绘制词云图展示;为了挖掘热点研究方向,后续又从高频词集中剔除了不能反映热点研究方向的词语,得到31个热点关键词;随后建立共词矩阵、相异矩阵,并利用层次聚类法进行分析.论文研究方法可以为其他领域探寻热点研究方向提供参考.
天然产物、词云图、层次聚类、共词分析、文献计量
29
R95(药事组织)
2020-08-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
1326-1333