语言模型表征空间和时间 发表评论 351 views 中文标题:语言模型表征空间和时间 英文标题:Language Models Represent Space and Time 发布平台:预印本 发布日期:2023-01-01 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 相关资源 中文标题:语言模型表征空间和时间 英文标题:Language Models Represent Space and Time 发布平台:预印本 发布日期:2023-01-01 引用量(非实时): DOI:10.48550/ARXIV.2310.02207 作者:Wes Gurnee Read more
语言模型的物理学 3.2:知识操控 发表评论 464 views 中文标题:语言模型的物理学 3.2:知识操控 英文标题:Physics of Language Models: Part 3.2, Knowledge Manipulation 发布平台:预印本 发布日期:2023-09-25 引用量(非实时):3 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 相关资源 中文标题:语言模型的物理学 3.2:知识操控 英文标题:Physics of Language Models: Part 3.2, Knowledge Manipulation 发布平台:预印本 发布日期:2023-09-25 Read more
语言模型的物理学 1:含深层逻辑的语法树 发表评论 419 views 中文标题:语言模型的物理学 1:含深层逻辑的语法树 英文标题:Physics of Language Models: Part 1, Context-Free Grammar 发布平台:无 发布日期:2023-01-01 引用量(非实时):10 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 相关资源 中文标题:语言模型的物理学 1:含深层逻辑的语法树 英文标题:Physics of Language Models: Part 1, Context-Free Grammar 发布平台:无 预印本 发布日期:2023-01-01 引 Read more
语言模型的物理学 3.1:知识存储和提取 发表评论 468 views 中文标题:语言模型的物理学 3.1:知识存储和提取 英文标题:Physics of Language Models: Part 3.1, Knowledge Storage and Extraction 发布平台:无 发布日期:2023-01-01 引用量(非实时):3 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 半合成可控数据 2.2 模型训练 2.3 知识增强 2.4 知识探索 2.5 其他实验和补充 相关资源 中文标题:语言模型的物理学 3.1:知识存储和提取 英文标题:Physics of Langua Read more
龙猫法则:训练计算最优的大语言模型 发表评论 888 views 中文标题:训练计算最优的大语言模型 英文标题:Training Compute-Optimal Large Language Models 发布平台:预印本 发布日期:2022-03-29 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐⭐ 2 精读笔记 2.1 相关工作 2.2 策略制定 2.3 Chinchilla 模型 2.4 实验分析 3 后记 相关资源 中文标题:训练计算最优的大语言模型 英文标题:Training Compute-Optimal Large Language Models 发布平台:预印本 发 Read more
解耦上下文处理上下文增强语言建模 发表评论 508 views 中文标题:解耦上下文处理上下文增强语言建模 英文标题:Decoupled Context Processing for Context Augmented Language Modeling 发布平台:NeurIPS 发布日期:2022-10-11 引用量(非实时):7 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 方法说明 2.3 实验分析 相关资源 中文标题:解耦上下文处理上下文增强语言建模 英文标题:Decoupled Context Processing for Context Augme Read more
文本分类器模型鲁棒性改进的集成方法研究 发表评论 513 views 中文标题:文本分类器模型鲁棒性改进的集成方法研究 英文标题:Investigating Ensemble Methods for Model Robustness Improvement of Text Classifiers 发布平台:EMNLP 发布日期:2022-10-28 引用量(非实时): 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 2.1 背景介绍 2.2 方法细节 2.3 实验分析 相关资源 中文标题:文本分类器模型鲁棒性改进的集成方法研究 英文标题:Investigating Ensemble Metho Read more
SMedBERT_医学语义知识增强型预训练模型 发表评论 1421 views 中文标题:SMedBERT_医学语义知识增强型预训练模型 英文标题:SMedBERT: A Knowledge-Enhanced Pre-trained Language Model with Structured Semantics for Medical 发布平台:ACL 发布日期:2021-01-01 引用量(非实时):22 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 模型细节 2.3 实验分析 相关资源 中文标题:SMedBERT_医学语义知识增强型预训练模型 英文标题:SMedBERT Read more
DKPLM_知识增强分解式预训练模型 发表评论 1390 views 中文标题:DKPLM_知识增强分解式预训练模型 英文标题:DKPLM: Decomposable Knowledge-enhanced Pre-trained Language Model for Natural Language Understanding 发布平台:AAAI 发布日期:2022-06-28 引用量(非实时):7 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 主观评分:⭐⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 模型细节 2.3 实验分析 相关资源 中文标题:DKPLM_知识增强分解式预训练模型 英文标题:DKPLM: Decomp Read more
中文语境的否定与推断意图识别 发表评论 1502 views 中文标题:中文语境的否定与推断意图识别 英文标题:Negation and Speculation Identification in Chinese Language 发布平台:ACL 发布日期:2015-01-01 引用量(非实时):33 1 文章萃取 1.1 核心观点 1.2 综合评价 1.3 评分:⭐⭐⭐ 2 精读笔记 2.1 背景知识 2.2 语料构建 2.3 线索词检测 2.4 范围解析 2.5 线索词检测-实验 2.6 范围解析-实验 2.7 后记补充 相关资源 中文标题:中文语境的否定与推断意图识别 英文标题:Negation and Speculat Read more