10.3969/j.issn.1001-3695.2015.09.006
多变参p LS I文本敏感特征抽取算法
敏感词等特征的抽取是社交网络敏感话题分析的关键环节。目前热门的概率主题模型在社交网络敏感话题分析领域,受到特征语义复杂以及高噪声的影响,处理性能不够理想。提出了一种多变参概率潜在语义索引(pLSI)算法,可以利用社交网站标签、文本表情图片等多种辅助信息提高特征抽取的效果。实验数据显示,该算法有较高的分类准确率和较低的时间开销。该算法是理想的降维算法,适用于社交网络的敏感特征抽取。
特征抽取、敏感特征、潜在概率语义索引、多变参、话题分析
TP391.1;TP301.6(计算技术、计算机技术)
国家公安部重大项目基金资助项目201202ZDYJ017;河南省教育厅科学技术研究重点资助项目14A520011
2015-09-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
2587-2589