作者文章归档:王半仙

KNN 最近邻算法

K 近邻算法(k-nearest neighbors, KNN)是一种很基本的机器学习方法

算法步骤:给定样本,寻找最近的 K 个样本进行(分类/回归)预测

KNN的 3 个核心要素:

  • K 值的选择,较小时容易过拟合;较大时泛化性好,但训练误差大
  • 距离度量方式,比如欧氏距离、曼哈顿距离(常见距离测度
  • 决策规则,分类问题常用投票法,回归问题常用平均法

KNN 的主要优点:

  • 理论成熟,思想简单,既可以用来做(非线性)分类也可以用来做回归
  • 训练时间复杂度比支持向量机之类的算法低,仅为 O (n)
  • 和朴素贝叶斯之类的算法比,对数据没有假设,准确度高,对异常点不敏感
  • 对于类域的交叉或重叠较多

Read more

图特征工程_Python实现

前置知识: 特征工程_图

依赖环境:networkx

数据和环境准备:

import networkx as nx

G = nx.karate_club_graph()
# 空手道俱乐部 34 名成员的社交网络

图的平均度

def average_degree(num_edges, num_nodes):
    avg_degree = 2*num_edges/num_nodes
    avg_degree = int(round(avg_degree))
    return avg_degree

num_edges 

Read more

特征工程_图

前置知识:图论基础

代码实践:图特征工程_Python实现

节点中心性度量

度中心性 (Degrree Centrality):

  • 用节点的度来描述节点的重要性,即邻接节点数越多的节点越重要
  • 在不同网络间比较时,需要除以网络总节点数进行标准化

特征向量中心性 ( Eigenvector Centrality): $$ c_v=\frac{1}{\lambda}\sum_{u\in N(v)}c_u $$

  • 节点的重要性取决于邻接节点的重要性之和
  • 其本质对应一个图邻接矩阵的特征向量求解问题

介数中心性

Read more

PyG-图神经网络构建

PyG (PyTorch Geometric),基于 PyTorch 编写和训练图神经网络 (GNN)

  • 集成了各种针对图或其他不规则结构的深度学习方法
  • 包括易用小批量加载器,可在许多小型和单个巨型图上运行
  • 多 GP​​U 支持,torch.compile 支持,DataPipe 支持
  • 内置大量基准数据集、支持神经网络的

Read more

NetworkX-复杂网络分析

NetworkX 是一个 Python 包,常用于创建、操作和挖掘图/复杂网络

  • 支持以标准和非标准数据格式加载和存储网络
  • 生成多种类型的随机和经典网络;网络可视化
  • 分析网络结构、构建网络模型、设计新的网络算法

官方文档

本教程默认使用 NetworkX=3.2.1

1 图的基本操作

1.1 图的创建与类型

G = nx.Gr

Read more

前端技术简史

"切图仔"(2006)

  • 在 css3 之前,前端开发者能做的事情很有限,前端语言的能力非常薄弱
  • 一个简单的圆角矩形样式要拼八张图片,更别提动画阴影之类的特效
  • 大量的工作时间都是在拆卸设计稿,然后将做完后的静态页面交给后端

jQuery 问世(2006)

  • jQuery 是对原生 js 的封装,简化了繁琐的 js 开发
  • 开发人员可以更容易地操作 html 、处理事件、创建动画和发起 AJAX 请求
  • 前端开发者已经可以承担一部分交互了,比如异步表单之类的
  • 最终实现较为稳定的开发方式:DIV+CSS+jQuery+后端渲染

随着 web 项目开发越来越复杂,原生 cc

Read more

EvoLLM:自动化模型融合进化框架

中文标题:模型融合配方的迭代优化

英文标题:Evolutionary Optimization of Model Merging Recipes

发布平台:预印本

发布日期:2024-03-19

引用量(非实时):

DO

Read more

模型融合 ModelMerge

基本概念

模型融合(model merging):

  • 将多个神经网络模型进行合并,得到一个融合模型
  • 优势在于节省计算/时间成本、无需训练数据(隐私保护)
  • 有时能取得类似多任务学习的效果,也可能具备更好的泛化性

思考:如何验证模型融合的合理性? (此处

Read more

struc2vec:从结构性标识中学习节点的表示

中文标题:struc2vec: 从结构性标识中学习节点的表示

英文标题:struc2vec: Learning Node Represen

Read more

LINE:针对大规模信息网络的嵌入表示

中文标题:LINE:针对大规模信息网络的嵌入表示

英文标题:LINE: Large-scale Information Network Embedding

发布平台:

Read more