1 JSON 内置库
适用内置库实现 json 的基本操作
import json
food_ratings = {"organic dog food": 2, "human food": 10}
json.dumps(food_ratings) # 将 Python 字典转换为 JSON 对象
# '{"organic dog food": 2, "human foo
分类目录归档:学习
适用内置库实现 json 的基本操作
import json
food_ratings = {"organic dog food": 2, "human food": 10}
json.dumps(food_ratings) # 将 Python 字典转换为 JSON 对象
# '{"organic dog food": 2, "human foo
Mean Shift 算法,又称为均值漂移算法
核心思想:
算法流程:
$$ S_h\left(x\right)=\left(y\mid\left(y-x\right)\left(y-x\right)^T\leqslant h^2\right) $$ 2. 计算该
样条(spline)通常是指分段定义的多项式参数曲线
样条函数是一种由分段多项式拼接而成的平滑函数,可用于逼近或插值数据
常见的样条函数:
线性样条 | 二次样条 | 三次样条 | B样条(B-spline) |
---|---|---|---|
每个子区间上使用一阶多项式,即直线段<br><br>它们在节点处具有零阶连续性,即函数值连续,但导数不连续 | 在每个子区间上使用二阶多项式<br><br>在节点处通常要求函数值和一阶导数连续 | 在每个子区间上使用三阶多项式<br><br>在节点处要求函数值、一阶导数和二阶导数都连续 |
MD5:32 位,单向哈希,不可逆,速度快,破解难度低
SHA256:256 位,单向哈希,不可逆,速度较快,破解难度中等
BCrypt:可变位数,单向哈希,不可逆,速度慢,破解难度高
PBKDF2:可变位数,单向哈希,不可逆,速度可调,破解难度可调
Scrypt:可变位数,单向哈希,不可逆,速度慢,破解难度高
加盐,在输入信息中随机添加字符串(salt)以提高哈希算法的安全性
MD5 消息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以
摘自 Joy Triggers: How to Find Happiness on Demand
分库:将表按照某种规则拆分到多个数据库中,来保证系统的稳定和性能
分表:将表中数据按照某种规则拆分到多张表中,提升查询效率
分库分表的原因
单表超 500 万行,或容量超 2GB 时推荐分库分表——阿里开发手册
分库分表的常见方法
将某个库中的表拆分到多个库,一般按照业务维度拆分
优点:降低单数据库服务的压力,增加系统可用性;业务清晰,
用美国股票总市值与 GDP 的比值来衡量股票市场的估值
巴菲特认为,当该指标介于0.9和1之间,则市场被视为估值合理,而当该比率超过1.2则认为估值过高,在该指标接近2时买入美股,相当于“玩火”
20240710:“巴菲特指标”升至 1.96,达到 2021 年底以来的最高水平
估值 =(3 年平均增速 x 100+10)x 确定性
确定性定为一个范围在 0-1.3
PageRank 是早期 Google 搜索的核心算法,决定了搜索结果中的网页展示顺序
PageRank 核心思想:
$$PR(j) = \sum_{i \rightarrow j} \frac{PR(i)}{l_i}$$
上式最大的问题在于忽略了"不存在外链的特殊页面"
因此 PageRank 算法引入了阻尼系
背景故事:啤酒与尿布
Aprior 算法的 3 个关键评价指标:
$$ Support(X,Y) = P(XY) = \frac{number(XY)}{num(All Samples)} $$ 2. 置信度(Confidence):商品 Y 出现后,商品 X 出现的概率 $$ Confidence(X \Leftarrow Y) = P(X|Y)=P(XY)/P(Y) $$ 3. 提升度(Lift):商品 X 出现的情况中,商品 Y 也出现的概率 $$ Lift(X \Leftarrow Y) = P(X|Y)