分类目录归档:ai | Digital Garden | 王半仙

分类目录归档：ai

2024 年 AI 发展的个人小结

320 views

AI 发展的现状总结：

主流模型的性能均追赶上 GPT4，OpenAI 的技术壁垒逐渐消解
大模型价格战加剧，LLMs 的训练和推理成本持续走低（DeepSeek）
高质量数据用尽，基础大模型的主要玩家都采用了大量的合成数据
LLMs 发展放缓，AI 动力从数据驱动转为推理驱动（GPT4-> GPT-o3）

AI 发展的社会影响：

互联网内容生态发展转变，StackOverflow 12 月问题数同比减少六成
基础 LLMs 成本过高，零一万物开始向轻量化，专业化方向拓展
LLMs 多模态功能普及，接入 LLMs 的语音助手、具身智能发展迅速
个人电脑可以离线运行 GPT4 级

2024 企业中的生成式 AI 现状

1093 views

参考文章：2024: The State of Generative AI in the Enterprise

核心观点：

企业生成式 AI 正在从实验转向执行；2024 年 AI 支出 138 亿美元， 2023 年是 23 亿；72% 的决策者预计在不久的将来，会更广泛地采用生成式 AI 工具
企业生成式 AI 仍处于大规模转型的早期阶段；企业生成式 AI 投资的 60% 来自创新预算；超过三分之一的受访者对于实施生成式 AI 没有明确的愿景，仍在探索生成式 AI 对企业的作用
生成式 AI 正在深入到程序应用中； 2024 年 AI 应用支出 46 亿美元， 2023 年是 6 亿

深度学习的 GPU 选配

1336 views

1 GPU 的基本概念
2 适合 DL 的 GPU
3 其他 GPU 资源或资料

结论：

现阶段 4090 能满足 DL 的入门需要，且 LLMs 推理的性价比最高
缺点是性能不足够支持 LLMs 训练（通信不高效，显存不够用）

1 GPU 的基本概念

NVIDIA 的三个产品线：

GeForce 类型：面向个人计算和游戏市场推出的产品线，适用于游戏、图形处理等，并且在深度学习上的表现也非常出色，很多人用来做推理、训练，性价比高。例如目前热门的 4090、3090等型号
Quadro 类型：定位于专业可视化市场的产品线，主要面向专业人士和企业用户，例如，影视制作、建筑可视化、产品

CO-STAR 提示词框架

1376 views

Sheila Teo 凭借 CO-STAR 提示词框架赢得了首届 GPT-4 提示工程大赛

（C）上下文（Context）：提供与任务有关的背景信息。这有助于 LLM 理解正在讨论的具体场景，从而确保其响应是相关的。
（O）目标（Objective）：定义你希望 LLM 执行的任务。明晰目标有助于 LLM 将自己响应重点放在完成具体任务上。
（S）风格（Style）：指定你希望 LLM 使用的写作风格。这可能是一位具体名人的写作风格，也可以是某种职业专家（比如商业分析师或 CEO）的风格。这能引导 LLM 使用符合你需求的方式和词语给出响应。
（T）语气（Tone）：设定响

大模型的显存占用

3026 views

模型占用
推理占用
训练占用
微调占用
参考

前置知识：模型参数的数据类型

工具推荐：常见模型的显存占用计算器

模型占用

大模型的显存占用主要取决于以下几点：

参数量：以常见的大模型 Llama2为例，其常见的参数量包括7B、13B、70B；其中B表示十亿（billion）的参数级别，7B也就代表70亿个参数
参数精度：常见的浮点精度包括float32（占用4字节，32bit）、float16（16bit）、int8（8bit）、int4（4bit）等，占用空间依次递减，但模型的预测效果也会下滑

以Llama2-7B模型为例，在精度为float32的情况下，模型占用显存为： $$7