中文标题:将专家意见信号融入股票预测中:深度学习框架
英文标题:Incorporating Expert-Based Investment Opinion Signals in Stock Prediction: A Deep Learning Framework
发布平台:AAAI
Proceedings of the AAAI Conference on Artificial Intelligence
发布日期:2020-04-03
引用量(非实时):34
DOI:10.1609/aaai.v34i01.5445
作者:Heyuan Wang, Tengjiao Wang, Yi Li
文章类型:journalArticle
品读时间:2023-12-13 16:42
1 文章萃取
1.1 核心观点
本文方法有三个主要组成部分,1. MFN 立场检测网络,用于从公众评论中提取专家的投资意见信号(看涨/看跌);2. 专家立场聚合模块,用于基于动态专家挖掘程序识别和汇总高质量意见;3. 股票预测模块,该模块结合专家意见指标来预测个股的未来走势
最终实验表明,MFN 网络在立场检测中显著优于基线(2.5%~3.5%);同时实验结果证明了专家挖掘模块对于筛选优质舆情对于股市走势预测的重要性
1.2 综合评价
- 很有意思的思路,根据网络历史评论从网友中挖掘投资专家来辅助预测
- 实现过程略显粗糙,TPO 构建需要人工构建词典,专家挖掘系统可以有更丰富的维度考量;最后的预测模型也比较简单,存在优化的空间(部分画图也有点丑)
1.3 主观评分:⭐⭐⭐⭐⭐
2 精读笔记
2.1 多视图融合网络 MFN
TPO (时间,预测/观点,对象)结构化序列
- 以三元组的方式从文本中提取不同意见和库存实体的匹配关系
- 以下面的文本为例:“目前不要再追乐视了,买入格力此是绝佳时机。顺便说一句,根据理论推算,上汽集团即将回暖。”,可以抽取出的 TPO 序列如下:
# “追、买入、回暖”被识别为预测术语
{(目前,不要追,乐视),(绝佳时机,买入,格力),(即将,回暖,上汽)}
TPO 的解析逻辑:
- 先根据金融词典、时间描述、股票术语识别文本中所有的 TPO
- 当存在前置否定词时,对观点 P 进行反转(替换为反义词)
- 对于每个 P,寻找其左侧最近的 T 作为该元组的参考(缺失填补为
NO_TIME
) - 对于每个 P,寻找其两侧最近的 O(股票实体);对于存在多个 O 的情况,构建多个 TPO 元组;未到到 O 时,缺失填补为
NO_TAR
为了避免提取的 TPO 元组过于稀疏,考虑构建广义类进行聚合;比如“目前”和“绝佳时机”都归类到“现在”,“买入”和“回暖”都归类到“看涨”
MFN(Multi-view Fusion Network)主要用于立场检测:
- MFN 先使用两个编码器从 n-gram 单词和结构化序列中提取多视图语义特征
- 然后将不同的表示集成到融合向量中,以计算作者的投资意见信号(看涨/看跌)
2.2 专家立场聚合和股票预测
为了区分高质量的投资意见,减少非专家的误导性噪音,本文设计了动态专家挖掘系统,并将其应用到每只股票上。专家挖掘系统伪代码:
- 汇总用户$u$在过去一段时间内的投资倾向(看涨/看跌/中性),然后与实际股价变化进行对比;其中$C$记录了该用户预测正确的次数,$I$记录了用户预测错误的次数
- 专家挖掘系统通过评估用户在段时间(根据测试显示 90天间隔最佳)内的预测准确率来进行排名;其中排名最高的 Top50 用户将作为专家,其对应投资信号会纳入后续模型
- 专家排名系统在每个交易日动态更新,以确保基于专家的聚合机制的有效性
个股股票预测模块:
- 输入为股票的时序特征,包括各类指标和专家意见的聚合信号
- 中间的特征处理过程主要使用 GRU 网络(看论文描述,没啥特殊的细节)
- 最终的预测有三种方式:(1)直接使用GRU 层的最后一个记忆单元隐藏状态进行预测 (2)将GRU 层的记忆单元隐藏状态先经过线性组合,再用于预测 (3)使用时间感知的注意力层来动态组合隐藏状态,然后预测
2.3 实验结果和分析
实验数据说明:
- 网络爬取:6136128 位股吧用户撰写的 165823986 条评论 (1/1/2010∼6/10/2018),以及218049 位雪球用户撰写的 6052765 条评论 (9/11/2017∼6/10/2018),涉及股票3501只
- 筛选其中的 2w条数据进行人工标注(看涨/看跌/中立,发布时间,作者id,股票id)
不同模型对比与消融实验:
- 三分类是看涨/看跌/中立,二分类是看涨/看跌
- MFN w/o TPO:不带 TPO 编码器的 MFN 变体
- MFN w/o KE:MFN 变体,不包含字级编码器
个股预测结果对比:
- 仅使用专家意见的效果,显著高于使用所有用户文本
- 使用所有用户文本,有时还不如不用文本时的表现好
GRU 三种预测方式对比: