10.3969/j.issn.1000-3428.2013.04.047
基于半监督CRF的缩略词扩展解释识别
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习.为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词.使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系.实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法.
扩展解释、半监督、条件随机场、序列熵、序列标注
39
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61105049;高等学校博士学科点专项科研基金资助项目20100031110096;中央高校基本科研业务费专项基金资助项目65010571
2013-08-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
203-209