机器学习与量化交易实战10

1 回顾

  1. 爬取数据
  2. 数据的清洗
  3. 特征工程、机器学习、量化指标
  4. 模型评估、回测风控
  5. 构建系统

2 论文速读

附件/20130506050541242.pdf 标题:Stock Price Forecasting using Support Vector Machines and Improved Particle Swarm Optimization 日期:2012-06-02

特点:

  • 采用SVM+粒子滤波(在时序数据中表现优于卡尔曼滤波)进行建模
  • 基本输入为价格+其他量化指数

附件/Pasted image 20210827141211.png

  • 但是最后的模型评价和回测有点糟糕

附件/multi-svm.pdf 标题:Modeling high-frequency limit order book dynamics with support vector machines 日期:2014-04-14

特点:

  • 整体架构清晰严谨

附件/Pasted image 20210827144831.png

  • 特征选择丰富可用(分为时间敏感类特征和时间不敏感类特征)

附件/Pasted image 20210827144813.png

  • 有相关复现代码
  • 就是代码解读相关的文章链接失效咯~

代码解析

3 案例分析

标题: high frequency trading- How I made $500k with machine learning and HFT 日期:2012-11-06

特点:

  • 针对Russel 2000和DAX期货合约进行高频交易
  • 每日交易频次达到了1000-4000笔(一半做多,一半做空)
  • 没有一天损失超过2000美元,也没有一个月亏损

深度解析

标题: SVR预测股票开盘价 日期:2016

特点:

  • 利用SVR建立的模型对股票每日开盘价进行回归拟合
  • 数据量小,特征过于简单,建模只用了默认参数,无需深入研究;可以作为反面教材反思

标题:基于SVM的机器学习策略 日期:2017

特定:

  • 特征包括indicator,valuation,income等46个指标
  • 因变量设定存在偏斜,不太适合SVM模型
  • 不能随便进行样本随机,只用了1/5的现金,无需深入研究

4 课程推荐

耶鲁大学公开课:金融市场 相关课件

麻省理工学院公开课 :随机系统分析与应用概率 相关课件

麻省理工学院公开课:多变量微积分

麻省理工学院公开课:微分方程

麻省理工学院公开课:计算机科学及编程导论

哈佛大学公开课:计算机科学

斯坦福大学公开课:编程范式

麻省理工公开课:线性代数

quantsoftware机器学习和量化投资课程

5 书籍推荐

《高性能python》 《机器学习实战》《机器学习系统设计》 《期货市场技术分析》《主动投资组合管理》《可视化量化金融》 《Python金融大数据分析》 《代码之髓 / Effective Python / 编程珠玑》 《Python编程快速上手—让繁琐工程自动化》 《Learn Python the hard way》 《Introduction to statistical learning》 《图解机器学习》

6 面试技巧

面试宝典:

重要问题:

  • 如何解决过拟合的情况
  • 正则化的理解和意义

往年同期文章