基于文本生成语言模型的股指预测
股指预测是金融领域中一个重要课题.随着计算能力和技术的发展,从在线新闻中识别和量化有价值的信息为提高股指预测表现创造了机会.本文为将关于股票指数预测框架的计量经济学文献扩展到高维文本数据提出了一种基于生成语言模型的股票指数预测框架.该预测框架可以分为两个步骤.首先,使用有监督生成语言模型快速过滤噪声词语,并将剩余文本聚合成可以充分解释股指变动的新闻指数.其次,将该新闻指数和历史股指数据共同作为时变参数预测模型的自变量来预测股指未来价值.该框架不仅丰富了股票指数预测的影响因素并且揭示了这些因素与股票指数价值之间的时变动态关系.实证研究展示了该预测框架解释能力和样本外预测能力.在预测的6个行业股指中,本文提出的预测框架得到的均方误差普遍小于传统时间序列和机器学习方法.与没有考虑新闻信息的时变参数预测模型和长短期记忆网络相比该预测框架也表现了更好的预测性能.
深度学习、分布式多项回归、负二项回归、股指预测、文本分析、时变参数模型
32
TP391.1;TP181;F830.91
国家自然科学基金;广东省自然科学基金面上项目
2023-10-25(万方平台首次上网日期,不代表论文的发表时间)
共11页
54-64