分类目录归档:学习 | Digital Garden

分类目录归档：学习

NP-Hard问题

发表评论

2007 views

1 基本概念
2 NP-Hard问题示例
- 2.1 旅行商问题
- 2.2 哈密顿回路
3 NP-Hard问题的求解
参考

1 基本概念

P问题：能在多项式时间内解决的问题，比如快速排序/冒泡排序

NP问题：能在多项式时间内验证得出一个正确解的问题（不确保在多项式时间内找到答案）

NP-Complete（NPC）问题：属于NP问题，其他所有属于NP的问题都可以规约成它

规约（Reduction）：将问题A转化为问题B，使用问题B的解来解问题A

如果问题A可规约为问题B，说明问题B的时间复杂度要大于或等于问题A的时间复杂度，即问题B的难度一般要比问题A大（毕竟B答案能解A，A不一定能解

时序聚类

发表评论

2491 views

1 GBTM
2 GMM及其变种
3 其他方法

本文中大部分算法都可通过R语言的latend包复现

1 GBTM

轨迹分组算法（Group-based trajectory model，GBTM）

最早由 Daniel Nagin 于 1999 年在知名心理学方法学杂志「Psychological Methods」开始推展
接着由 Bobby Jones 与 Daniel Nagin 于 2001 年发表了 SAS procedure2，于是此方法慢慢

医院信息系统入门

发表评论

1208 views

HIS：医院信息系统(Hospital Information System)，为各部门提供病人诊疗/行政管理信息的收集/存储/处理/提取/交换

LIS：实验室信息管理系统(Laboratory Information Management System)，专为医院检验科设计的一套信息管理系统

PACS：医学影像存档与通讯系统(Picture archiving and communication systems)，医学图像的获取/显示/存贮/传送/管理的综合系统

RIS：放射信息管理系统(Radioiogy information system)，是优化医院放射科工作流程管理的软件系统,

最速下降法

发表评论

2284 views

首先，理解梯度向量是指向函数值增长最快的方向的：MIT18.02笔记-梯度的定义与理解

定义函数$f(x)$，其在点$x$处沿着方向$d$的变化率可用方向导数表示，即梯度与方向的乘积： $$Df(x;d)=\nabla f(x)^Td$$ 当$d=-\frac{\nabla f(x) }{ ||\nabla f(x)|| }$时，函数$f$在点$x$处的下降速率最大，即负梯度方向为最速下降方向

最速下降算法：在迭代过程，每次都选择负梯度方向搜索（对于寻找最小值的最优化问题）

最速下降算法步骤：

初始化$x_1$，设定允许的最小误差$\epsilon$，迭代次数$k=1$
对于第$k$次迭

共轭梯度法

发表评论

2518 views

1 共轭方向法
2 共轭梯度法
3 非线性共轭梯度

共轭梯度法（Conjugate Gradient）是介于最速下降法与牛顿法之间的一个方法

仅需利用一阶导数信息，但克服了最速下降法收敛慢的缺点，
避免了牛顿法需要存储和计算海森矩阵（占用空间大）并求逆的缺点
求解大型线性方程组或非线性最优化问题时常用且高效的方法

1 共轭方向法

设$G$为对称正定矩阵，若$d^T_mGd_n=0,\ m\neq n$ ，则称$d_m$和$d_n$为“G共轭”，共轭方向是“互不相关”的方向

共轭是正交的推广，$n$个共轭向量可以作为$n$维空间的非正交基，共轭向量间是线性无关的

共轭方向法的核心思路

傅里叶变换

发表评论

2617 views

1 傅里叶变换
- 1.1 基本定义
- 1.2 理解傅里叶变换
2 快速傅里叶变换
3 图的傅里叶变换

1 傅里叶变换

1.1 基本定义

传统傅里叶变换的定义为（积分形式）：$F(\omega)=\mathcal{F}{f(t)}=\int f(t)e^{-i\omega t}dt$

传统逆傅里叶变换的定义为（积分形式）：$f(t)=\mathcal{F}^{-1}{F(\omega)}=\frac{1}{2\pi}\int F(\omega)e^{i\omega t}d\omega$

卷积定理：函数卷积的傅里叶变换是函数傅立叶变换的乘积 $$f\ast g=\mathcal{F}^{

ART-对抗性鲁棒性工具集

发表评论

2233 views

1 基本介绍
2 核心架构
3 官方示例

1 基本介绍

对抗性鲁棒性工具集（Adversarial Robustness Toolbox，ART）是用于机器学习安全性的Python库

从逃逸，数据污染，模型提取和推断的对抗性威胁等方面捍卫和评估模型
适用广泛，支持所有常见的数据类型、机器学习任务、机器学习框架

本项目由IBM团队在2019年开源。项目文档不是特别完善，但是示例丰富，API设计

回归内生性问题

发表评论

2462 views

1 内生性问题
2 自然实验法
3 双重差分法 DID
4 工具变量法 IV
5 其他方法
参考

1 内生性问题

对于回归方程$Y = a + bX + e$，当解释变量$X$和误差项$e$存在相关性时，说明回归模型存在内生性问题

内生性问题的产生原因：

遗漏变量（比如在分析学历和收入的关系时，容易忽略个人能力的影响）
反向因果（比如分析政策对经济影响时，要意识到经济对政策也是有影响的）
选择偏误（样本选择偏误和自选择偏误）、以及测量误差等

内生性问题的后果：在小样本下，内生变量和外生变量估计系数都有偏。在大样本下，内生变量估计系数不一致。外生变量如果与内生变量不相关，则估计系数一

Optuna-超参优化

发表评论

2834 views

1 基本介绍
2 简单上手
3 进阶用法

1 基本介绍

Optuna 是一个为机器学习设计的自动超参数优化软件框架

轻量级、多功能和跨平台架构；依赖少，安装简单
Python式搜索空间（条件语句和循环均为Python语法）
高效的优化算法；先进的超参采样方法，支持剪枝算法
易用的并行优化；少量改动代码即可实现多服务器并行
便捷的可视化；支持各种绘图函数展示优化历史记录

项目地址
 官方文档
 中文文档：不推荐，因为很久没更新了（230331）

截至230331，Op

核密度估计

发表评论

2498 views

核密度估计（kernel density estimation，简称KDE）是核平滑对概率密度估计的应用，即一种以核为权重估计随机变量概率密度函数的非参数方法。由Rosenblatt (1955)和Emanuel Parzen(1962)提出，又名Parzen窗（Parzen window）

核密度估计的实现：

假设$(x_1,x_2,...,x_n)$是来自同一个单变量未知分布中的独立样本
核密度估计可以根据这些样本推测出该分布的概率密度函数：

$$\hat{f}_h(x)=\frac{1}{n}\Sigma_{i=1}^nK_h(x-x_i)=\frac{1}{nh}\Sigma_

个人笔记

Digital Garden | 王半仙

1 基本概念

1 GBTM

1 共轭方向法

1 傅里叶变换

1.1 基本定义

1 基本介绍

1 内生性问题

1 基本介绍