KAN :Kolmogorov-Arnold 网络 发表评论 713 views 原始标题:KAN: Kolmogorov-Arnold Networks 发布平台:预印本 发布日期:2024-05-24 引用量(非实时):15 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 KAN 网络原理 2.3 MLP vs KAN 2.4 KAN 能力评估 2.5 KAN 的实验分析 后记 相关资源 原始标题:KAN: Kolmogorov-Arnold Networks 发布平台:预印本 发布日期:2024-05-24 引用量(非实时):15 DOI: 作者:Ziming Liu, Read more
Mamba:选择性状态空间的线性时序建模 发表评论 1195 views 中文标题:Mamba:选择性状态空间的线性时序建模 英文标题:Mamba: Linear-Time Sequence Modeling with Selective State Spaces 发布平台:预印本 发布日期:2023-12-01 引用量(非实时):201 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 状态空间模型 2.2 S4:结构化 SSM 时序建模 2.3 从 S4 到 Mamba 2.4 Mamba 细节 1:信息的选择 2.5 Mamba 细节 2:并行与硬件感知 2.6 实验结果分析 3 论文后续 Read more
EvoLLM:自动化模型融合进化框架 发表评论 601 views 中文标题:模型融合配方的迭代优化 英文标题:Evolutionary Optimization of Model Merging Recipes 发布平台:预印本 发布日期:2024-03-19 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 2.1 算法细节 2.2 实验分析 相关资源 中文标题:模型融合配方的迭代优化 英文标题:Evolutionary Optimization of Model Merging Recipes 发布平台:预印本 发布日期:2024-03-19 引用量(非实时): DO Read more
CALM:可信的自适应语言建模 发表评论 493 views 中文标题:CALM:可信的自适应语言建模 英文标题:Confident Adaptive Language Modeling 发布平台:NIPS 发布日期:2022-10-25 引用量(非实时):36 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 算法细节 2.3 实验分析 相关资源 中文标题:CALM:可信的自适应语言建模 英文标题:Confident Adaptive Language Modeling 发布平台:NIPS NeurIPS 发布日期:2022-10-25 引用量(非实时):3 Read more
Treeformer:用于高效注意力计算的密集梯度树 发表评论 480 views 中文标题:Treeformer:用于高效注意力计算的密集梯度树 英文标题:Treeformer: Dense Gradient Trees for Efficient Attention Computation 发布平台:ICLR 发布日期:2023-03-17 引用量(非实时):3 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 TreeFormer 变体 2.3 实验分析 相关资源 中文标题:Treeformer:用于高效注意力计算的密集梯度树 英文标题:Treeformer: Dense Gr Read more
基于语言模型构建可组合的机器人3D操纵图 发表评论 651 views 中文标题:基于语言模型构建可组合的机器人3D操纵图 英文标题:VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models 发布平台:预印本 发布日期:2023-07-12 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 方法说明 2.3 实验分析 相关资源 中文标题:基于语言模型构建可组合的机器人3D操纵图 英文标题:VoxPoser: Composable 3D Value Read more
盘古:基于3D神经网络的中期全球天气准确预测 发表评论 1218 views 中文标题:基于3D神经网络的中期全球天气准确预测 英文标题:Accurate medium-range global weather forecasting with 3D neural networks 发布平台:Nature 发布日期:2023-07-05 引用量(非实时):1 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 方法说明 2.3 实验分析 2.4 文章后记 相关资源 中文标题:基于3D神经网络的中期全球天气准确预测 英文标题:Accurate medium-range globa Read more
基于多任务训练框架处理标注分歧的问题 发表评论 577 views 中文标题:标注分歧的处理:超越主观认知的多数投票法 英文标题:Dealing with Disagreements: Looking Beyond the Majority Vote in Subjective Annotations 发布平台:TACL 发布日期:2022-01-31 引用量(非实时):106 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 方法说明 2.3 实验分析 相关资源 中文标题:标注分歧的处理:超越主观认知的多数投票法 英文标题:Dealing with Disagre Read more
ShorT:用于医疗AI公平的捷径学习检测和预防 发表评论 684 views 中文标题:ShorT:用于医疗AI公平的捷径学习检测和预防 英文标题:Detecting and Preventing Shortcut Learning for Fair Medical AI using Shortcut Testing (ShorT) 发布平台:无 发布日期:2022-07-21 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 捷径学习的背景 2.2 捷径学习的识别 2.3 实验结果与总结 相关资源 中文标题:ShorT:用于医疗AI公平的捷径学习检测和预防 英文标题:De Read more
基于因果框架的医疗领域数据分布偏移评估 发表评论 622 views 中文标题:基于因果框架的医疗领域数据分布偏移评估 英文标题:Diagnosing failures of fairness transfer across distribution shift in real-world medical settings 发布平台:NeurIPS 发布日期:2023-02-10 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 算法细节 2.3 实验分析 相关资源 中文标题:基于因果框架的医疗领域数据分布偏移评估 英文标题:Diagnosing Read more