10.3772/j.issn.1000-0135.2012.08.004
基于贝叶斯分类的中文物种描述文本的语义标注研究
本研究从<中国植物志>中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注.通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率.采用先导词后,F平均值提高0 048~0 107,尤以Fr为2时效果最好,整体标注性能F平均值高达0 902.各元素的标注性能也较为理想.Fr分别取1、2、3时,大部分元素的F值为0 730~0 964.
朴素贝叶斯、先导词、物种描述文本、语义标注
31
TP3;TP1
教育部人文社会科学青年项目"基于深度语义标注的网络中文学术信息抽取研究"10YJC870004
2012-10-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
805-812