发表评论
16 views
Agent:能够自主收集信息、制定计划并执行动作的智能体
Agent 分层:
Agent 分类
前置知识: 10.《动手学深度学习》注意力机制
原始 Tansformer(左) VS 线性 Tansformer(右):
大语言模型(LLMs)的上下文学习:经过预训练的 LLMs 能根据文本提示或任务示例来直接对下游任务进行预测,而无需更新模型权重,这种能力也被称为上下文学习(in-context learning,ICL)或语境学习
简单来说,ICL 就是在不更新模型参数的前提下,通过输入经典示例作为提示来增强模型的能力
以情感分析为例,来说明 ICL 的一般流程(图源):
ICL 的分类:
LSH(locality sensitivity Hashing,局部敏感性哈希)算法
以相似文档检索为例,说明 LSH 的算法过程
Shingling,文档进行向量化表示
Min-Hashing,对文档信息进行降维
TabPFN 的主要特点:
在分组比较中都占优势的一方,在总评中有时反而是失势的一方
一个辛普森悖论的典型示例:
性别 | 法学院录取人数 | 法学院申请人数 | 法学院录取比例 | 商学院录取人数 | 商学院申请人数 | 商学院录取比例 | 合计录取比例 |
---|---|---|---|---|---|---|---|
男生 | 8 | 53 | 15.1% | 201 | 251 | 80.1% | 68.8% |
女生 | 51 | 152 | 33.6% | 92 | 101 | 91.1% | 56.5% |
合计 | 59 | 205 | 293 | 352 |
ASA 分级标准,指的是美国麻醉医师协会(ASA)于麻醉前根据
辛普森悖论 提醒我们在分析数据时要仔细考虑分组和混杂因素的影响,而因果推断的作用就是使用适当的方法识别和控制这些因素,从而可以更好地解释数据中的关系,并做出可靠的结论。
相关性与因果性:
因果关系的三个阶段(由易到难):
贝叶斯神经网络(Bayesian neural networks, BNNs):