仅搜集收录了部分个人感兴趣的文章,并进行简单记录
发表评论
450 views
发表评论
627 views
1 前言
本文主要围绕作者科研十年的感悟和思考,进行总结和探索
本书框架如下:
- 第一章前言
- 第二章介绍现代科研的知识背景与认识框架
- 第三章介绍现代社会及现代科研趋势与问题
- 第四章介绍科研思维
- 第五章介绍实验
- 第六章介绍数据分析
- 第七章介绍文献管理
- 第八章介绍学术生活
- 第九章介绍离开学术界的就业途径
附录
- 现代科研工具包
- 检验本书阅读效果的试题
- 调侃风格的科研版词
发表评论
404 views
发表评论
368 views
1 DBSCAN算法概况
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,基于密度的、对噪声鲁棒的空间聚类方法)是一种基于密度的经典聚类算法
2 DBSCAN算法细节
- 遍历所有样本,寻找关键的核心点(邻域内样本数>=MinPoints)
- 核心点及其邻域内的样本(包括其他核心点)形成了临时聚类簇
- 当核心点A属于核心点B的临时聚类簇时,合并两处临时聚类簇
- 重复以上过程,直至找不到新的可合并临时聚类簇
发表评论
458 views
中文标题:CALM:可信的自适应语言建模
英文标题:Confident Adaptive Language Modeling
发布平台:NIPS
发布日期:2022-10-25
引用量(非实时):3
发表评论
423 views
生物圈2号是一个占地1.3万平方米,由玻璃和钢架构成的巨型建筑物,位于美国亚利桑那州图森市北部的Oracle地区。它由美国石油大王爱德华·巴斯投资2亿美元建造,于1989年完成。它的名字来源于它的原始模型“生物圈1号”,即地球。
生物圈2号内部模拟了地球上五种不同的生态系统,分别是热带雨林、海洋、荒漠、草原和沼泽。每个生态系统都有自己的气候、植被、动物和微生物。此外,还有一个居住区和一个农业区,为人类提供住所、食物和水源。
生物圈2号的设计理念是一个完全自给自足和循环利用的系统,没有任何外界的干扰和补给。利用太阳能作为能源来源,利用植物产生氧气,利用废物进行肥料和燃料。旨在模拟地球上各种
发表评论
447 views
中文标题:Treeformer:用于高效注意力计算的密集梯度树
英文标题:Treeformer: Dense Gr
发表评论
442 views
1 简介
能否得到有用的回答,往往取决于你所提问和追问的方式
本书将教你如何正确的提问以获得你满意的答案
能立刻得到快速并有效答案的最好方法,就是像赢家那样提问──聪明、自信、有解决问题的思路,只是偶尔在特定的问题上需要获得一点帮助
2 在提问之前
在提问之前,请先做到以下事情:
- 尝试在你准备提问的论坛的旧文章中搜寻答案。
- 尝试上网搜寻来找到答案。
- 尝试阅读手册来找到答案。
- 尝试阅读常见
发表评论
511 views
本人常用Chrome浏览器,不保证推荐插件在其他浏览器中支持
Tampermonkey 油猴脚本管理器 ⭐⭐⭐⭐⭐
可支持的脚本很丰富,可玩性很高;有空单独开一篇文章讲一下 #待补充
immer
发表评论
1221 views
前置知识:模型参数的数据类型
模型占用
大模型的显存占用主要取决于以下几点:
- 参数量:以常见的大模型 Llama2为例,其常见的参数量包括7B、13B、70B;其中B表示十亿(billion)的参数级别,7B也就代表70亿个参数
- 参数精度:常见的浮点精度包括float32(占用4字节,32bit)、float16(16bit)、int8(8bit)、int4(4bit)等,占用空间依次递减,但模型的预测效果也会下滑
以Llama2-7B模型为例,在精度为float32的情况下,模型占用显存为: $$7\times 10^9\times