10.3969/j.issn.1000-1220.2019.03.009
词关联规则层状稀疏主题编码模型
模型规则化可以通过给模型加入先验知识,而避免模型过拟合,并且能够使模型参数稀疏,选择出最有代表性的模型参数.具有稀疏性的主题特征能够更有效的表示文本语义信息,通过WordNet和Word2Vec可以得到相似词集,将相似词集的编码向量归属为相同组,构造相似词组语义约束,并将其表示为层状结构化先验信息,论文因此而实现了两种层状稀疏规则化方法,应用于主题编码模型.实验表明采用层状规则化的稀疏编码模型可以提高主题模型编码效果,学习到主题一致性、分类结果更好的文本主题信息.
主题编码、层状规则、词分组、稀疏
40
TP391(计算技术、计算机技术)
国家自然科学基金项目41661083
2019-06-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
510-514