LDA 算法是一种监督学习的降维技术
- LDA 算法将高维空间中的d维数据通过投影转化成1维数据进行处理
- 对于训练数据,LDA 算法会让同类数据的投影点尽可能接近,异类数据尽可能远离
- 对于新数据分类,LDA 算法会先进行数据投影,再根据投影点位置来确定样本的类别
- 左图思路:让不同类别的平均点距离最远的投影方式
- 右图思路:让同类别的数据距离最近的投影方式
LDA算法降维流程如下:
输入:数据集 $D = { (x_1,y_1),(x_2,y_2), ... ,(x_m,y_m) }$,其中样本 $x_i$ 是n维向量,$y_i \in {C_1, C_2, ..., C_k}$