分类目录归档：学习

提示工程 Prompt

发表评论

1863 views

基础提示技巧
思维链与自洽性
- 思维链提示 CoT
- 自洽性 self-consistency
提示工程进阶
提示工程实践
- 常用提示词技巧与经验
- JSON 格式修复

基础提示技巧

一个好的提示包含以下内容：系统提示、角色提示、语境提示、示例提示

提示词基础技巧

肯定式指令，减少不精确的模糊描述，提高紧迫感（PUA）
通过示例明确输出格式，必要时可引导任务的拆分或自检
找一个好的提示词框架，明确角色、目标、行为、场景与期望

系统提示

系统提示：定义模型的基本功能和总体目标

Agent 通信协议

发表评论

1790 views

MCP 模型上下文协议
A2A 智能体通信协议
AP2 智能体支付协议
Function Calling 模型调用
- 其他 Agent 协议

MCP 模型上下文协议

MCP 协议基本架构（图源）

由 Anthropic 提出，用于标准化 LLMs 与外部系统交互的接口
开发者能以统一的方式将大模型对接到各种数据源和工具
MCP 采用了经典的 C/S 架构，包含主机、服务端和客户端三部分

目前 MCP 协议已得到了广泛的生态支持，兼具通用性和灵活性

MCP 底层通信

MCP 的会话管理

通过一个健壮

过敏性休克 Anaphylaxis

发表评论

2063 views

定义与诊断
检测和预测
个性化治疗

定义与诊断

过敏性休克

一种严重、可能危及生命的过敏反应，通常由接触药物、食物或毒液引起
可影响多个身体系统，如皮肤、呼吸道、消化系统和心血管系统
其重要性在于其突然发作和迅速进展
如果不及时有效治疗，可能导致休克、呼吸困难和甚至死亡

美国过敏性休克的终身患病率估计在 0.05%至 2%之间

过敏性休克的临床标准：美国国立过敏和传染病研究所（NIAID）金标准

标准 1：急性发作的疾病（从几分钟到几个小时），伴随皮肤、黏膜组织或两者的受累（例如，全身性荨麻疹、瘙痒或潮红、嘴唇-舌头-悬雍垂肿胀）并且至少有以下之一： a. 呼吸困难（例如，呼

流形学习降维 UMAP

发表评论

2362 views

UMAP 算法

全称为均匀流形近似与投影，Uniform Manifold Approximation and Projection
UMAP 是一种基于黎曼几何和代数拓扑理论框架的数据降维与可视化算法
UMAP 能同时捕捉数据的局部和全局结构，可拓展性强，对嵌入维度没有限制
MAP 不具备PCA 或因子分析等线性技术可以提供的解释性（因子载荷）

UMAP 定义的概念解释与补充：

Uniform 均匀假设：通过空间的扭曲，对样本稀疏/密集的位置进行收缩或拉伸
Manifold 流形：一种拓扑空间，每个点的附近局部类似于欧几里得空间
Approximation 近似：用一组有限的样本组

t-SNE 降维可视化

发表评论

1923 views

t-SNE 算法

全称为 t 分布-随机邻近嵌入（t-distributed Stochastic Neighbor Embedding）
该算法将高维空间中的数据映射到低维空间中，并保留数据集的局部特性
t-SNE 算法能够捕捉数据间的非线性关系，数据可视化效果好，常用于探索性数据分析
t-SNE 算法的缺点主要是占用内存较多、运行时间长，容易丢失大规模信息 (集群间关系)

算法过程概述：

计算原始高维空间中数据点之间的相似度：对于样本 $i$，算法会使用以 $i$ 为中心的高斯分布来计算其他数据点的条件概率 $P_{j|i}$，进而得到样本 $i$ 和样本 $j$ 在高维原

Pydantic 数据验证与转换

发表评论

1753 views

示例 1：Pydantic 模型与验证器
示例 2：装饰器来验证函数的参数
示例 3：验证和集成环境变量

Pydantic 是目前最流行的 Python 数据验证工具

Python 作为一种动态类型语言，在开发和易用性上存在优势
因此也需要对程序进行功能更强大的类型检查和数据验证

Pydantic 的特点

自定义与扩展：可用于任意 Python 对象的数据类型验证，支持嵌套结构
验证的灵活性：类型丰富，验证的时间点灵活，严格模式 vs 宽松模式
序列化：Pydantic 对象支持序列化和反序列化为字典和 JSON 字符串
高性能：核心验证逻辑基于 Rust 编写，性能出色且可靠，

调查问卷分析

发表评论

2402 views

Delphi 专家函询
样本量估计
调查问卷的评价
统计学分析

调查问卷分析的一般流程：

初步设计调查问卷并严格评估合理性，比如文献研究，对象访谈，Delphi 专家函询
针对少量人群（40~60 人）展开预调查，了解调查问卷设置条目的合理性，完整性和可理解性
确保预调查结果质量，包括调查内容审核录入与信效度分析（此步骤也适用于正式调研阶段）
估计样本量，确定调查人群，完成调查员培训，分配调查任务并展开具体的正式调查
对调查结果进行数据分析，包括分布描述，独立性检验，方差分析，相关性分析，多因素分析等
根据初步分析结果，进行整理和深入的分析，得到可验证的结果，最后撰写调查报告

De

注意力机制进阶

发表评论

1805 views

普通线性注意力
Flash Attention
Lightning Attention
NSA
MoBA
DeltaNet

前置知识： 10.《动手学深度学习》注意力机制

普通线性注意力

原始 Tansformer（左） VS 线性 Tansformer（右）：

N：序列长度，在自然语言处理任务中，指句子中 Token 或词的数量。
d：特征维度，即每个元素（如单词的词向量）的维度。
O(N²d)、O(Nd²) ：计算复杂度。大 O 描述了计算量随输入序列变长的增长速度，如 O(N²d) 表示计算量与 N² 和 d 成正比。
Q（Query）：“查询” 矩阵，用于在自注意力机制中

上下文学习 ICL

发表评论

1669 views

大语言模型（LLMs）的上下文学习：经过预训练的 LLMs 能根据文本提示或任务示例来直接对下游任务进行预测，而无需更新模型权重，这种能力也被称为上下文学习（in-context learning，ICL）或语境学习

简单来说，ICL 就是在不更新模型参数的前提下，通过输入经典示例作为提示来增强模型的能力

以情感分析为例，来说明 ICL 的一般流程（图源）：

ICL 需要一些示例来形成一个用于情景演示的上下文，作为提示输入来增强 LLMs
ICL 示例一般用自然语言模板编写，并拼接真实的输入查询（Text）与结果（Label）

ICL 的分类：

Few-shot learning，

LSH 局部敏感性哈希

发表评论

1551 views

LSH（locality sensitivity Hashing，局部敏感性哈希）算法

一种从海量数据中进行相似性搜索的算法
常用于文本查重、图像识别、推荐系统和搜索引擎

以相似文档检索为例，说明 LSH 的算法过程

Shingling，文档进行向量化表示
- 统计 k 个文档中连续出现的 token（字符或单词）
- 按照 one_hot 的形式对文档进行向量化的矩阵表示
- 每一列表示一个文档，每一行表示文档的信息矩阵
Min-Hashing，对文档信息进行降维
- 依次对文档矩阵的每一列进行重排序
- 选择第一个非 0 行的行号作为的最小哈希值
- 重复多次，得到若干个最小哈希组成的文档矩阵

个人笔记

Digital Garden | 王半仙

基础提示技巧

系统提示

MCP 模型上下文协议

MCP 底层通信

定义与诊断

De

普通线性注意力