10.3969/j.issn.1002-137X.2007.05.055
一种对聊天文本进行特征选取的方法研究
由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷.针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性.
文本挖掘、聊天文本、TFIDF
34
TP3(计算技术、计算机技术)
2007-07-02(万方平台首次上网日期,不代表论文的发表时间)
共3页
202-204