PageRank 是早期 Google 搜索的核心算法,决定了搜索结果中的网页展示顺序
PageRank 算法最初用于网页权重的计算,它将每个网作为一个节点,网页间的超链接作为边,而最终的网页 X 权重描述了以 X 为起点,通过超链接进行随机游走 $N$ 次后,再次返回网页 X 的概率。同时为了防止随机游走进入死循环,每次随机游走还有概率 $=\alpha$ 的情况随机跳转到任意网页,不同网页的随机跳转概率是相等的
PageRank 核心思想:
- 根据网站的外部链接和内部链接的数量和质量衡量网站的价值
- 如果重要性为 $PR(i)$ 的页面 $i$ 有 $l_i$ 个外链(出度),则每个