谱聚类

1 算法概况

谱聚类(spectral clustering):一种基于图的聚类算法

前置知识:图论基础概念图论基础#3.1 理解拉普拉斯矩阵

核心思想:将数据转化为图的形式,距离近的数据间对应的边权重高,距离远的数据间对应的边权重低。之后通过切图的方式,使得不同子图间的边权值和尽可能低,子图内部的边权值和尽可能高,从而达到聚类的目的

2 算法细节

2.1 数据转图

核心思想:把每个样本看作一个节点,然后构建任意两点$(x_i,x_j)$间权重边$w_{ij}$

方法1

Read more

正则表达式

1 概念理解

正则表达式(Regular Expression,简写为regex、或RE)是一种描述句法规则的字符串,常用来匹配符合某个模式(pattern)的文本,以实现针对特定文本的检索(search,findall)、替换(replace)等目的。

常见应用:文本/文件查找、数据/网页清洗、非格式化数据转格式化

在线测试:https://www.mklab.cn/utils/regex

2 正则入门

正则表达式30分钟入门教程

3 常

Read more

图论基础

图论起源:柯尼斯堡七桥问题

1 基础概念

图 (graph) 常用$G=(V,E)$表示,其中$V$表示顶点/节点的集合,$E$表示边的集合

相邻的 (adjacent)/关联的 (incident)

  • 边两端的顶点和边的关系是关联的或相邻的
  • 通过边相连接的两个顶点之间的关系是相邻的

顶点的度 (degree):与该顶点关联的边的条数。

  • 对于有向图

Read more

GCN_基于图卷积网络的半监督学习

中文标题:GCN_基于图卷积网络的半监督学习

英文标题:Semi-Supervised Classifi

Read more

论文评测数据_LLMs篇

AlpacaEval:主流大语言模型评测

AlpacaEval是一种由斯坦福大小推出的LLM自动评估工具

  • 其特点是快速、廉价且可靠
  • AlpacaEval 与真实人类注释的一致性很高

  • 2023-09-20 Xwin-LM在 AlpacaEval 上基准测试

Read more

论文期刊汇总

Read more

基于知识图谱的多约束问答

中文标题:基于知识图谱的约束问答

英文标题:Constraint-Based Question Answering with Knowledge G

Read more

SMedBERT_医学语义知识增强型预训练模型

中文标题:SMedBERT_医学语义知识增强型预训练模型

英文标题:SMedBERT

Read more

DKPLM_知识增强分解式预训练模型

中文标题:DKPLM_知识增强分解式预训练模型

英文标题:DKPLM: Decomp

Read more

《动手学深度学习》总结

1 基本信息

1.1 书籍名称### 1 什么是 Docker:《动手学深度学习》

1.2 撰写作者:阿斯顿·张,李沐等

1.3 出版日期:在线书籍

1.4 品读时间:2021年12月-2022年8月

1.5 整体耗时:约60h

2 什么是

Read more