智力肥胖

2019 年,伯克利的研究人员发现,信息对大脑多巴胺产生的奖励系统的作用与食物相同。信息在大脑中的奖励系统中产生多巴胺,就像食物一样,这导致我们对信息的渴求变得像对食物的渴求一样强烈。

在信息过剩的时代,人们试图通过大量生产低质量的“垃圾信息”来吸引我们的注意力,这种信息就像思维的快餐,廉价而令人满足,但缺乏营养。垃圾信息包括包括八卦、琐事、吸引点击的内容、劣质新闻、营销、重复报道和胡言乱语,任何你无法利用的信息都是垃圾信息

由于你的多巴胺通路无法区分有用和无用的信息,消费垃圾信息让你感觉像是在学习——它提供了精神营养的假象——尽管你实际上只是在往大脑里塞虚拟爆米花

沉迷于无用信息最终会导

Read more

CO-STAR 提示词框架

Sheila Teo 凭借 CO-STAR 提示词框架赢得了首届 GPT-4 提示工程大赛

  • (C) 上下文(Context):提供与任务有关的背景信息。这有助于 LLM 理解正在讨论的具体场景,从而确保其响应是相关的。
  • (O) 目标(Objective):定义你希望 LLM 执行的任务。明晰目标有助于 LLM 将自己响应重点放在完成具体任务上。
  • (S) 风格(Style):指定你希望 LLM 使用的写作风格。这可能是一位具体名人的写作风格,也可以是某种职业专家(比如商业分析师或 CEO)的风格。这能引导 LLM 使用符合你需求的方式和词语给出响应。
  • (T) 语气(Tone):设定响

Read more

进程、线程与协程

进程

进程是资源(CPU、内存等)分配的基本单位,它是程序执行时的一个实例

程序运行时系统就会创建一个进程,并为它分配资源,然后把该进程放入进程就绪队列,进程调度器选中它的时候就会为它分配 CPU 时间,然后程序开始真正运行

Linux 系统函数 fork() 可以在父进程中创建一个子进程:

import os

print('当前进程:%s 启动中 ....' % os.getpid())
pid = os.fork()
if pid == 0:
    print('子进程:%s,父进程是:%s' % (os.getpid()

Read more

常见哈希算法

MD5:32 位,单向哈希,不可逆,速度快,破解难度低

SHA256:256 位,单向哈希,不可逆,速度较快,破解难度中等

BCrypt:可变位数,单向哈希,不可逆,速度慢,破解难度高

PBKDF2:可变位数,单向哈希,不可逆,速度可调,破解难度可调

Scrypt:可变位数,单向哈希,不可逆,速度慢,破解难度高

加盐,在输入信息中随机添加字符串(salt)以提高哈希算法的安全性

MD5 算法

MD5 消息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码散列函数,可以

Read more

影响快乐和幸福的化学物质

摘自 Joy Triggers: How to Find Happiness on Demand

  • Dopamine. 多巴胺。这种神经递质在动机和奖励预期中发挥着重要作用。当你实现一个目标、完成一项任务或达到一个目标时,你会感受到多巴胺的愉悦。基本上是你的大脑告诉你你做得很好。许多类型的愉悦体验,例如性、饮食和玩电子游戏,都会增加多巴胺的释放,因此让你想要重复这些体验。
  • Serotonin. 血清素。虽然血清素具有复杂的生物功能,但它通常被称为幸福分子。多种称为血清素特异性重摄取抑制剂 (SSRI) 的抗抑郁药的作用是在信号传输完成后干扰血清素的正常重吸收,从而增加突触中的血清素水平。它

Read more

数据分库和分表

摘自:谈谈为什么要分库分表? - fuxing

分库:将表按照某种规则拆分到多个数据库中,来保证系统的稳定和性能

分表:将表中数据按照某种规则拆分到多张表中,提升查询效率

分库分表的原因

  • 分库原因:数据量过大,而磁盘空间、内存、CPU 有限
  • 分表原因:单表承载能力有限,随着数据规模的增加,表索引效率降低
  • 其他原因:分布式或微服务架构,根据业务需求和功能对数据库进行划分

单表超 500 万行,或容量超 2GB 时推荐分库分表——阿里开发手册

分库分表的常见方法

  1. 垂直分库

将某个库中的表拆分到多个库,一般按照业务维度拆分

优点:降低单数据库服务的压力,增加系统可用性;业务清晰,

Read more

知识图数据资源

中文综合

中文开放知识图谱

网站链接: http://www.openkg.cn/

数据分类概述: 常识 (27)、医疗 (23)、新冠专题 (15)、生活 (11)、娱乐 (11)、地理 (10)、城市 (9)、社交 (8)、出行 (6)、金融 (5)、科教 (5)、商业 (4)、OpenKG 评测 (4)、气象 (3)、其他 (3)、物联网 (2)、schemata (2)

英文综合

FreeBase

FreeBase 是一个由社区贡献内

Read more

OpenAI 模型规范方法论

目标:设定宽泛而基本的原则,为模型的期望行为指明方向。

  • 协助开发者和用户:通过遵循指令,并提供有效的响应,帮助用户达成目标。
  • 造福人类:依据 OpenAI 的使命,考虑到可能对内容创作者和广大公众带来的益处与风险。
  • 塑造 OpenAI 的正面形象:遵守社会规范和相关法律。

规则:为处理复杂情况提供指南,确保安全性和合法性

  • 遵循命令链(chain of command)
  • 遵守相关法律
  • 不提供敏感危害的信息
  • 尊重创作者及其版权
  • 保护个人隐私
  • 避免回应不宜工作场所的内容(NSFW )

默认行为:提供与目标和规则相符的指南,帮助解决冲突,并指导如何权衡和优先处理各种目标

  • 假设用户或开发者

Read more

CS224W 图机器学习08:知识图的学习

1 知识图基本介绍

知识图(Knowledge graph):以图的形式存储知识

  • 节点表示实体(entitles),节点的标签可以是实体类型
  • 节点之间的边表示两个实体之间的关系
  • 所以知识图是异构图的一种特殊情况

知识图示例:生物知识图(蛋白质/药物/疾病/不良事件)

知识图应用:信息检索服务、问答和对话

常见的开源 KG :知识图数据资源

这类知识图一般是百万级别的,存在很多边的缺失(考虑补齐)

Read more

同音文

所谓“同音文”,就是整个文章中的汉字只允许采用现代汉语普通话同一个音,四声不限,标点不限,大多是文言,这样的文章叫做“同音文(一音文)”。

《施氏食狮史》 石室诗士施氏,嗜食狮,誓食十狮。适施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。

《熙戏犀》 西溪犀,喜嬉戏。席熙夕夕携犀徙,席熙细细习洗犀。犀吸溪,戏袭熙。席熙嘻嘻希息戏。惜犀嘶嘶喜袭熙

《羿裔熠, 邑彝, 义医, 艺诣.》 熠姨遗一裔伊, 伊仪迤, 衣旖, 异奕矣. 熠意伊矣,

Read more