10.3969/j.issn.1008-0821.2009.08.001
自然语言理解心理学在短文本分类中的实证研究
目前对文本分类研究多数集中在对大规模语料基础上的特征选择或分类器算法的研究.本文是建立在训练样本少且样本长度短的基础上,根据人脑对自然语言理解的心理学原理"人们总是根据已知的最熟悉的、最典型的例子进行判断,只有在该方法不奏效的时候才使用频率这一概念,并且使用的是十分简单的频率"从该角度进行短文本分类的实证研究.以心理学中的"熟悉原理"、"典型原理"等为模型建立特殊词库和典型案例词库,改进了传统文本分类的实验步骤,同时提出了该方法的优势和局限性.
文本分类、短文本、特征选择、自然语言、心理学
29
TP391(计算技术、计算机技术)
该项目基于上海政法学院计算机实验室决策支持系统项目
2009-10-19(万方平台首次上网日期,不代表论文的发表时间)
共4页
4-7