作者文章归档:王半仙

知识图数据资源

中文综合

中文开放知识图谱

网站链接: http://www.openkg.cn/

数据分类概述: 常识 (27)、医疗 (23)、新冠专题 (15)、生活 (11)、娱乐 (11)、地理 (10)、城市 (9)、社交 (8)、出行 (6)、金融 (5)、科教 (5)、商业 (4)、OpenKG 评测 (4)、气象 (3)、其他 (3)、物联网 (2)、schemata (2)

英文综合

FreeBase

FreeBase 是一个由社区贡献内

Read more

OpenAI 模型规范方法论

目标:设定宽泛而基本的原则,为模型的期望行为指明方向。

  • 协助开发者和用户:通过遵循指令,并提供有效的响应,帮助用户达成目标。
  • 造福人类:依据 OpenAI 的使命,考虑到可能对内容创作者和广大公众带来的益处与风险。
  • 塑造 OpenAI 的正面形象:遵守社会规范和相关法律。

规则:为处理复杂情况提供指南,确保安全性和合法性

  • 遵循命令链(chain of command)
  • 遵守相关法律
  • 不提供敏感危害的信息
  • 尊重创作者及其版权
  • 保护个人隐私
  • 避免回应不宜工作场所的内容(NSFW )

默认行为:提供与目标和规则相符的指南,帮助解决冲突,并指导如何权衡和优先处理各种目标

  • 假设用户或开发者

Read more

CS224W 图机器学习08:知识图的学习

1 知识图基本介绍

知识图(Knowledge graph):以图的形式存储知识

  • 节点表示实体(entitles),节点的标签可以是实体类型
  • 节点之间的边表示两个实体之间的关系
  • 所以知识图是异构图的一种特殊情况

知识图示例:生物知识图(蛋白质/药物/疾病/不良事件)

知识图应用:信息检索服务、问答和对话

常见的开源 KG :知识图数据资源

这类知识图一般是百万级别的,存在很多边的缺失(考虑补齐)

Read more

同音文

所谓“同音文”,就是整个文章中的汉字只允许采用现代汉语普通话同一个音,四声不限,标点不限,大多是文言,这样的文章叫做“同音文(一音文)”。

《施氏食狮史》 石室诗士施氏,嗜食狮,誓食十狮。适施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。

《熙戏犀》 西溪犀,喜嬉戏。席熙夕夕携犀徙,席熙细细习洗犀。犀吸溪,戏袭熙。席熙嘻嘻希息戏。惜犀嘶嘶喜袭熙

《羿裔熠, 邑彝, 义医, 艺诣.》 熠姨遗一裔伊, 伊仪迤, 衣旖, 异奕矣. 熠意伊矣,

Read more

经验投资指标

1 巴菲特指标

用美国股票总市值与 GDP 的比值来衡量股票市场的估值

巴菲特认为,当该指标介于0.9和1之间,则市场被视为估值合理,而当该比率超过1.2则认为估值过高,在该指标接近2时买入美股,相当于“玩火”

20240710:“巴菲特指标”升至 1.96,达到 2021 年底以来的最高水平

2 简易估值法

估值 =(3 年平均增速 x 100+10)x 确定性

确定性定为一个范围在 0-1.3 之间

Read more

HGT:面向异构图的 Transformer

英文标题:Heterogeneous Graph Transformer

发布平台:WWW

WWW

发布日期:2020-04-20

引用量(非实时):1064

DOI:10.1145/3366423.3380027

作者:Ziniu Hu, Yuxiao Dong, Kuansan

Read more

CS224W 图机器学习07:异构图的学习

1 异构图的定义与理解

异构图(Heterogeneous Graph),存在不同类型的节点和边

即节点和边至少有一个具有多种类型,常见于知识图谱的场景

举例:引文网络

  • 节点的类型可以是作者(Author)或文章(Paper)
  • 边的类型可以是引用(Cite)或类似(Like)

从异构图到标准图:

  • 可以将节点和边的类型视为 one-hot 形式的特征,以此区分类型
  • 比如将特征 [1, 0] 附加到每个“作者节点”;将特征 [0, 1] 附加到每个“纸节点”
  • 但该方法不适用于不同类

Read more

NEJM医学前沿24年1季度文章集锦

仅搜集收录了部分个人感兴趣的文章,并进行简单记录

1 概念科普

1.1 利用 AI 大模型,破解医疗数据困境

2024-03-16 15:31 文章链接

患者、医疗数据、基础模型三者的关系:

基础模型的优势:

  1. 数据增强:例如哈佛大学的研究者利用 DALL-E 生成皮肤病图片来训练分类模型,浙江大学的研究者开发的 PathAsst 基础模型能够生成病理学子领域的指令样本来训练其他模型
  2. 数据高效利用:上海交通大学的研究

Read more

BASIC重症医学24年1季度文章集锦

仅搜集收录了部分个人感兴趣的文章,并进行简单记录

1 概念科普

1.1 《英

Read more

古麻今醉24年1季度文章集锦

Read more