分类目录归档:computer

CO-STAR 提示词框架

Sheila Teo 凭借 CO-STAR 提示词框架赢得了首届 GPT-4 提示工程大赛

  • (C) 上下文(Context):提供与任务有关的背景信息。这有助于 LLM 理解正在讨论的具体场景,从而确保其响应是相关的。
  • (O) 目标(Objective):定义你希望 LLM 执行的任务。明晰目标有助于 LLM 将自己响应重点放在完成具体任务上。
  • (S) 风格(Style):指定你希望 LLM 使用的写作风格。这可能是一位具体名人的写作风格,也可以是某种职业专家(比如商业分析师或 CEO)的风格。这能引导 LLM 使用符合你需求的方式和词语给出响应。
  • (T) 语气(Tone):设定响

Read more

OpenAI 模型规范方法论

目标:设定宽泛而基本的原则,为模型的期望行为指明方向。

  • 协助开发者和用户:通过遵循指令,并提供有效的响应,帮助用户达成目标。
  • 造福人类:依据 OpenAI 的使命,考虑到可能对内容创作者和广大公众带来的益处与风险。
  • 塑造 OpenAI 的正面形象:遵守社会规范和相关法律。

规则:为处理复杂情况提供指南,确保安全性和合法性

  • 遵循命令链(chain of command)
  • 遵守相关法律
  • 不提供敏感危害的信息
  • 尊重创作者及其版权
  • 保护个人隐私
  • 避免回应不宜工作场所的内容(NSFW )

默认行为:提供与目标和规则相符的指南,帮助解决冲突,并指导如何权衡和优先处理各种目标

  • 假设用户或开发者

Read more

数据挖掘十大经典算法

2006 年 12 月,国际会议 IEEE International Conference on Data Mining(ICDM)评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.

  1. C4.5 分类决策树
  2. K-means 聚类算法
  3. 1_study/algorithm/支持向量机 SVM
  4. Apriori 关联规则算法
  5. EM 期望最大化算法
  6. PageRank 排序算法
  7. Adaboost 树集成算法
  8. KNN 最近邻算法
  9. Naive Bayes

Read more

前端技术简史

"切图仔"(2006)

  • 在 css3 之前,前端开发者能做的事情很有限,前端语言的能力非常薄弱
  • 一个简单的圆角矩形样式要拼八张图片,更别提动画阴影之类的特效
  • 大量的工作时间都是在拆卸设计稿,然后将做完后的静态页面交给后端

jQuery 问世(2006)

  • jQuery 是对原生 js 的封装,简化了繁琐的 js 开发
  • 开发人员可以更容易地操作 html 、处理事件、创建动画和发起 AJAX 请求
  • 前端开发者已经可以承担一部分交互了,比如异步表单之类的
  • 最终实现较为稳定的开发方式:DIV+CSS+jQuery+后端渲染

随着 web 项目开发越来越复杂,原生 cc

Read more

光流 Optical Flow

光流(Optical Flow)是计算机视觉中的一个重要概念,它主要描述的是图像序列中像素在时间维度上的运动变化。

简单来说,光流就是在连续的两帧图像之间,每个像素点的运动速度和方向。

光流的计算基于这样一个假设:在短时间内,连续的图像帧之间,像素的颜色值不会发生显著的变化。基于这个假设,我们可以通过比较连续的两帧图像,来计算出像素点在这两帧之间的运动。

光流有很多应用,例如在视频处理中,可以用来进行运动检测、物体跟踪等;在自动驾驶和机器人领域,可以用来进行场景理解、导航和避障等。

光流问题的主要挑战在于,它是一个典型的病态问题,即小的测量误差可能导致结果的巨大变化,因此需要采用复杂的优化

Read more

主板入门

主板(英语:mainboard)或母板(motherboard)也称主机板、系统板、逻辑板(logic board)、底板等,简称MB[1][2][3],是构成复杂电子系统例如电子计算机的中心或者主电路板

主板的主要功能是提供一系列接合点,形成一个能整合处理器、内存、存储装置(硬盘、固态驱动器、闪存等)、显示卡、声卡、网卡和各种外部设备的连接平台

主板主要功能分布:

常见 I/O 接口:

右下角指示灯:

常见版型:

参考

【硬件科普】从零开始认识主板(内含软广)

Read more

大模型的显存占用

大模型的显存占用主要取决于以下几点:

  1. 参数量:以常见的大模型 Llama2为例,其常见的参数量包括7B、13B、70B;其中B表示十亿(billion)的参数级别,7B也就代表70亿个参数
  2. 参数精度:常见的浮点精度包括float32(占用4字节,32bit)、float16(16bit)、int8(8bit)、int4(4bit)等,占用空间依次递减,但模型的预测效果也会下滑

以Llama2-7B模型为例,在精度为float32的情况下,模型占用显存为: $$7\times 10^9\times 4 bit=28\times 10^9/1024 KB=28\times 10^9/102

Read more

字符编码基础

ASCII

ASCII(American Standard Code for Information Interchange),也称 ANSI

  • 每个字符都对应唯一的一个数字,比如字符 A 对应的二进制数值是 01000001,对应的十进制就是65
  • 最开始 ASCII 只定义了128个字符编码,包括96个文字和32个控制符号

EASCII ,在 ASCII 基础上的扩展(由原来的 7 位扩充到 8 位),它完全兼容 ASCII,额外包括表格符号、计算符号、希腊字母和特殊拉丁符号

GBK

GB2312 编码,又称 GB0,1981由中国国

Read more

维度灾难

1 维度灾难

维数灾难(英语:curse of dimensionality,又名维度的诅咒)是一个最早由理查德·贝尔曼(Richard E. Bellman)在考虑优化问题时首次提出来的术语,用来描述当(数学)空间维度增加时,分析和组织高维空间(通常有成百上千维),因体积指数增加而遇到各种问题场景。

当维数提高时,空间的体积提高太快,因而可用数据变得很稀疏。稀疏性对于任何要求有统计学意义的方法而言都是一个问题,为了获得在统计学上正确并且有可靠的结果,用来支撑这一结果所需要的数据量通常随着维数的提高而呈指数级增长,也使得很多策略变得十分低效。

#维度灾难 #维度爆炸 #维

Read more