分类目录归档：学习

遗传算法

发表评论

2010 views

遗传算法（Genetic Algorithm, GA）是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型，是一种通过模拟自然进化过程搜索最优解的方法。

遗传算法的关键要素：

种群（population）代表问题可能潜在的解集的一个开始的
一个种群由经过基因（gene）编码的定数目的个体（individua）组成

核心过程：

编码：实现从表现型到基因型的映射，同时构建初代种群
选择：在每一代，根据问题域中个体的适应度（fitness）选择个体
变异：借助于遗传学算子(genetic operators)进行组合交叉和变异，产生代表新解集的种群
演化：按照适者生存和优胜

线性代数基础

发表评论

1724 views

1 Kronecker 乘积
2 海森矩阵

1 Kronecker 乘积

两个矩阵的 Kronecker 乘积 kron(X,Y) 为 X 的元素与 Y 的元素的所有可能乘积构成的较大矩阵。如果 X 为 m×n 且 Y 为 p×q，则 kron(X,Y) 为 mp×nq。元素以特定方式排列，呈现 X 的每个元素分别与整个矩阵 Y 相乘的结果。

X = [1   2； 3   4];
I = eye(2,2);
kron(X,I)
% result
ans =

     1     0     2     0
     0     1     0     2
     3     0

损失函数

发表评论

1663 views

1 损失函数的理解与区分
2 常见损失函数
3 交叉熵
4 Center Loss
5 Ranking Loss
参考

1 损失函数的理解与区分

如何理解并区分误差（error）/损失（loss）/成本（cost）/目标（objective）函数？

误差函数描述的是预测值与真实值的偏差：$y_{pred}-y_{true}$
损失函数是对预测误差的负面影响的量化，比如平方误差损失认为3个单位的误差会导致9个单位的负面影响；损失函数通常是针对单个样本的描述
损失函数是成本函数的一部分，成本函数通常是针对训练集的描述，既包含所有样本的损失，也包含针对模型复杂度的惩罚（正则项）
成本函数是

特征工程

发表评论

1538 views

特征工程常用
时序特征工程
- 格拉姆角场

特征工程常用

常用特征处理：

常见时间日期类特征：年/月/时、第几周/周次、是否周末、节假日、时差等
日期类聚合特征：客户最活跃的月份、某类产品上周累计销售、特定客户的周末消费额等
常用统计类特征：最值、均值、唯一值、偏度、峰度、KStat、分位数等

更多时序类衍生特征可参考1_study/Python/Python 数据处理/tsfresh 时序特征聚合工具

其他特征处理技巧：

多项式特征（preprocessing.PolynomialFeatures）
分箱（数值型变量转类别型变量，pandas.cut）
对数化（修正存

支持向量机

发表评论

1284 views

支持向量机（support vector machine，简称为SVM）

作为经典的有监督学习算法，常用于分类与回归分析问题中
支持向量机有着完备而优雅的数学理论，并且计算成本低效果好
在集成学习与深度学习流行前，SVM 在很多领域都是非常主流的算法

SVM 算法图解：

SVM 核心思想在于通过寻找一个超平面，尽可能的分隔不同类别间的样本
支持向量（support vector）：用于确定超平面边缘的部分样本

SVM 借助核技巧将输入隐式映射到高维特征空间中，从而有效地进行非线性分类

常见的核函数：

核函数	表达式	备注
Linear Kerne

金融常见理论

发表评论

1627 views

市场有效假说
CAPM
凯利公式

市场有效假说

在市场上的每个人都是理性的经济人
股票的价格反映了这些理性人的供求的平衡
股票的价格也能充分反映该资产的所有可获得的信息，即"信息有效"

#有效市场 #充分竞争 #完全竞争 #市场有效

CAPM

个股的CAPM:

$$r_i(t)=beta_i\times r_m(t)+alpha_i(t)$$ $$E(alpha(t))=0$$ 公式解析：个股的收益率主要取决于市场收益率$r_m$、个股和市场收益率的关系$beta_i$和个股的波动性$alpha_i$，模型默认个股波动性的期望值为0（市场有效假说成立）。

投资组

量化投资指标

发表评论

1774 views

1 常见缩写
2 基础指标
3 常见经济指标
4 常见股指
5 常见汇率
6 MTM 动量指标
7 BOLL指标
8 CCI指标
9 EMV指标
10 FI指数
11 夏普指数
12 价格动量 PMI
13 拥挤度
14 MACD
15 RSI

TA-LIB-内置 150 量化指标计算器

1 常见缩写

Time lags：过去时间点的特征，有不同的时间窗口
MA（Moving Average）：移动平均
EMA（Exponential moving average）：指数移动平均
SMA（Simple Moving Average）：简单移动平滑

# Moving Averages

基金的分类

发表评论

1497 views

主动式 vs 被动式
交易所交易基金 ETF

主动式 vs 被动式

被动式管理：复制大盘指数，持有。主动式管理：选择个股，频繁交易

交易所交易基金 ETF

交易所交易基金（Exchange Traded Fund，ETF）是一种开放式指数基金，旨在为投资者提供对某个特定市场、行业或投资策略的广泛暴露。

ETF的交易方式类似于个股，可以在证券交易所上市交易，可以通过普通经纪账户进行买卖
与传统指数基金相比，ETF具有更高的流动性和交易灵活性，可以在交易日内任何时间进行交易
ETF通常以低廉的费用提供多元化投资机会，因此成为越来越受欢迎的投资工具之一

股票交易术语

发表评论

1723 views

Limit Order Book 限价指令簿
HFT 高频交易
北向资金
参考

Limit Order Book 限价指令簿

A limit order book is a record of outstanding limit orders maintained by the security specialist who works at the exchange. A limit order is a type of order to buy or sell a security at a specific price or better. A buy limit order i

MATLAB进阶

发表评论

1479 views

1 高级数据类型
- 1.1 元胞数组
- 1.2 结构体
性能提升
- 1 向量化
  - 1.1 预分配
- 2 数值分析

1 高级数据类型

1.1 元胞数组

以其他数组的副本为元素的多维数组
使用 cell 函数可以创建空矩阵的元胞数组
通过花括号 {} 来创建元胞数组更常见
元胞数组可用于存储不同大小的矩阵序列

M = cell(8,1);
for n = 1:8
   M{n} = magic(n);
end
M
% reuslt
M = 
    [           1]
    [ 2x2  d

个人笔记

Digital Garden | 王半仙

1 Kronecker 乘积

1 损失函数的理解与区分

特征工程常用

市场有效假说

CAPM

1 常见缩写

主动式 vs 被动式

交易所交易基金 ETF

Limit Order Book 限价指令簿

1 高级数据类型

1.1 元胞数组