1 有偏方差VS无偏方差
有偏样本方差:$Var=\frac{1}{n}\Sigma_{i=1}^n(X_i-X_{mean})^2$
无偏样本方差:$Var=\frac{1}{n-1}\Sigma_{i=1}^n(X_i-X_{mean})^2$
当数据量较少时,无偏样本方差更合理;当数据量较大时,二者不存在明显差异
Python相关方差计算
- numpy包中默认计算方差是有偏的,无偏计算需要设定参数
ddof=1
- pandas包中默认计算方差是无偏的,有偏计算需要设定参数
ddof=0
2 条件概率密度函数
定义随机变量$X$的概率