10.3969/j.issn.1003-0077.2012.03.014
基于电子商务用户行为的同义词识别
该文研究了电子商务领域同义词的自动识别问题.电子商务领域的同义词是指对同一事物或概念的不同表达,即在商品描述和检索中可以相互替换的词,针对该领域新词多、错别字多、近义词多的特点,提出基于用户行为的同义词识别方法.首先通过并列关系符号切分商品标题和基于SimRank思想聚集查询两种方法获取候选集合,进而荻取两词的字面特征以及标题、查询、点击等用户行为特征,然后借助Gradient Boost Decision Tree模型判断是否同义.实验表明同义词识别准确率达到56.52%.
同义词识别、用户行为、SimRank、Gradient Boost Decision Tree
26
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60975077,90924015
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
79-85