10.3321/j.issn:0253-987X.2009.06.006
一种高稳定性词汇共现模型
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性.
项场、词汇共现、窗口内稳定性、数据集稳定性
43
TP391(计算技术、计算机技术)
国家高技术研究发展计划资助项目2006AA01Z101;教育部高等学校博士学科点专项科研基金资助项目20060698018
2009-07-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
24-27