Pydantic 是目前最流行的 Python 数据验证工具
- Python 作为一种动态类型语言,在开发和易用性上存在优势
- 因此也需要对程序进行功能更强大的类型检查和数据验证
Pydantic 的特点
- 自定义与扩展:可用于任意 Python 对象的数据类型验证,支持嵌套结构
- 验证的灵活性:类型丰富,验证的时间点灵活,严格模式 vs 宽松模式
- 序列化:Pydantic 对象支持序列化和反序列化为字典和 JSON 字符串
- 高性能:核心验证逻辑基于 Rust 编写,性能出色且可靠,
分类目录归档:学习
Pydantic 是目前最流行的 Python 数据验证工具
Pydantic 的特点
调查问卷分析的一般流程:
前置知识: 10.《动手学深度学习》注意力机制
原始 Tansformer(左) VS 线性 Tansformer(右):

大语言模型(LLMs)的上下文学习:经过预训练的 LLMs 能根据文本提示或任务示例来直接对下游任务进行预测,而无需更新模型权重,这种能力也被称为上下文学习(in-context learning,ICL)或语境学习
简单来说,ICL 就是在不更新模型参数的前提下,通过输入经典示例作为提示来增强模型的能力
以情感分析为例,来说明 ICL 的一般流程(图源):

ICL 的分类:
LSH(locality sensitivity Hashing,局部敏感性哈希)算法
以相似文档检索为例,说明 LSH 的算法过程

Shingling,文档进行向量化表示
Min-Hashing,对文档信息进行降维
TabPFN 的主要特点:
ASA 分级标准,指的是美国麻醉医师协会(ASA)于麻醉前根据
辛普森悖论 提醒我们在分析数据时要仔细考虑分组和混杂因素的影响,而因果推断的作用就是使用适当的方法识别和控制这些因素,从而可以更好地解释数据中的关系,并做出可靠的结论。
相关性与因果性:
因果关系的三个阶段(由易到难):
贝叶斯神经网络(Bayesian neural networks, BNNs):
谵妄的定义:POD 是一种急性发作的、暂时性脑功能异常。POD 多数发生在术后 1 周内, 以注意力不集中、意识水平变化和认知功能急性改变为特征。POD 可增加患者术后其他并发症发生率、延长住院时间、增加医疗费用和 30d 再人院率, 从而影响患者预后。
谵妄的常见临床表现: