10.3778/j.issn.1002-8331.2012.10.035
基于无监督学习的产品特征抽取
产品特征抽取是文本观点抽取和倾向性分析中的重要研究课题之一,提出了一种基于无监督学习的产品特征自动抽取方法.该方法从产品评论语句中抽取文本模式,以文本模式作为特征,将产品评论中所有的名词和名词短语(除产品名称)表示为向量,采用聚类算法将表示为向量的名词和名词短语聚为两类,以产品名称作为外部知识,利用表示“整体-部件”关系的文本模式识别产品特征集合.实验结果表明,该方法在电子产品领域的产品评论语料上取得了较好的实验效果.
产品评论、文本模式、“整体-部分”关系
48
TP391(计算技术、计算机技术)
国家科技重大专项2008ZX06315-001
2012-06-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
160-163