基于深层融合的股票文本主题识别
股票市场在资本市场中占据着重要地位,是经济的晴雨表.专家对股票的评论是投资者进行投资决策的重要依据.因此,如何快速有效地捕获众多专家股评的主题信息,成为股票研究领域的热点.然而目前大多数股票文本主题识别算法,其特征选择方法及分类模式多采用单一的标准.一般而言,单一的标准只能从某个侧面反映文本主题的识别效果,无法全面捕获目标的主体特征.事实上,不同的特征选择标准及分类器模型从不同侧面去理解文本,捕获的特征信息具有较强的互补性.为了提高股票文本主题识别的准确性,文章从信息融合的角度对股票文本进行了多层面融合:1)特征选择层,对多种特征选择方法进行加权融合,使其能够全面表征股票文本的特点;2)决策层,基于SVM-score,对多个分类器进行决策层融合,使其能够提高文本识别的准确性.基于实测数据的实验表明:相比单一模式的文本主题识别方法,文章提出的多层融合算法的识别精度明显更高.
特征选择、特征融合、SVM-score、文本分类、主题识别
46
TP391(计算技术、计算机技术)
国家自然科学基金61773244;烟台市重点研发计划项目2017ZH065,2019XDHZ081;赛尔网络下一代互联网技术创新项目NGII20170626;山东工商学院研究生科技创新基金项目3110318
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
122-126