10.3969/j.issn.1673-9221.2010.04.018
序差在文本区别特征研究中的应用
序差是同一个词在不同文本中的频率序之差,序差的大小反映了该词在不同文本中的地位差别.一个词的序差大小和这个词充当区别特征的资格的大小成正比.序差序即依据序差大小进行排序,也是区别特征资格序列表.序差序是文本区别特征提取的客观基础.本文统计、制作了<家>、<四世同堂>的序差表,提取了共有高频序差词和别有高频序差词作为文本区别特征,并对这些特征进行了验证,说明以序差为依据进行文本区别的方法是可行的.
频率序、序差、文本特征、提取、验证
P33;H31
国家985工程拓展项目"语言科学技术与当代社会建设跨学科创新平台"的子项目"言语风格研究及其在案件侦查中的应用"985YK009
2011-06-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
112-117