作者文章归档:王半仙

Streamlit-Extras 第三方组件

steamlit-extras是一个 Python 库,汇集了很多有用的 Streamlit 代码

官方文档

功能概述(部分):

  • add_vertical_space:增加空白行,常用于调整布局
  • altex:快速制作 Streamlit 图表,API 简单实用
  • annotated_text:文本显示格式优化(高亮、注释、文本框)
  • app_logo:在目录左上角显示指定的 LOGO
  • badge:创建自定义徽章(比如 PyPI, GitHub, Twitter, Buy Me a Coffee)
  • colored_header:标题美化,显示带有彩色下划线/添加标题说明
  • center_runn

Read more

Bilibili 评论-查理芒格经典演讲总结
  1. 要得到你想的某样东西,最可靠的办法是让你自己能配得上它
  2. 正确的爱应该以仰慕为基础
  3. 获得智慧是一种道德责任,它不仅仅是为了让你们的生活变得更加美好。(必须保持终身学习)学习如何学习的方法,发明如何发明的方法
  4. 什么是法律头脑,如果有两件事交织在一起,互相之间有影响,你努力只考虑其中一件,而完全不顾另一件,以这种思考方式既实用又可行的头脑就是法律头脑。 —-反话!!!真正重要的大道理占每个学科95%的分量,从所有学科中吸取自己所需要的95%的知识,并将它们变成思维习惯的一部分,然后去实践跨学科的方法。不要死记硬背,要掌握各种知识,让它们在头脑中形成一个思维框架,以便日后随时调用。
  5. 逆向思考,

Read more

辛辣食品摄入量与部分胃肠道癌症的风险负相关

中文标题:辛辣食品摄入量与胃肠道癌症风险:基于中国

Read more

SWE-BENCH:2294 个 GitHub 真实问题

随着 AI 模型的能力提升,人类需要一些更有趣的测试集来刁难他们~

GAIA:466个精心设计的问题和答案

SWE-BENCH:2294 个 GitHub 真实问题

项目地址

SWE-bench 是一个在现实软件工程(GitHub)环境中评估 LMs 的基准

  • 模型的任务是解决提交到流行 GitHub 项目的问题(通常是错误报告或功能请求)
  • 每个任务的解决方案都会生成一个 PR,描述要应用于现有代码库的更改
  • 最后,使用当前 GitHub 项目的测试框架评估修改后的代码

SWE-ben

Read more

GAIA:466个精心设计的问题和答案

GAIA 基准测试保留了 300 个问题用来构建 AI 模型的排名

  • GAIA 设计的问题对人类来说简直轻而易举,而对大多数 A 来说却很有挑战性
  • 即,人类回答准确率为 92%,而用上插件的 GPT-4 回答准确率仅为 15%
  • GAIA 设计的问题需要 AI 模型具备推理、多模态处理或工具使用熟练程度等基本能力

GAIA 的设计原则(原始论文):

  1. 概念上简单但多样化(对人类来说比较乏味,考验 AI 的快速适应力)
  2. 可解释性;让用户很容易理解模型的推理轨迹
  3. 对记忆的鲁棒性;计划并成功地完成一些步骤
  4. 易用性;问题的答案是简洁和明确的事实

GAIA 的问题示例:

  • 一级问题:最多只需要一

Read more

互联网广告_名词解释

广告形式

信息流广告:最传统的互联网广告方式,在2006年由Facebook 首先推出

Feeds流广告:原本是信息流广告的英文叫法,后逐步演变为直播间信息流广告

Feedslive:抖音直播间的一种广告形式,实时直播画面或实时画面+卡片

Banner:网页广告形式,通常以图像或多媒体的形式展示在网页上的特定位置

基础平台

DSP(Demand-Side Platform,需求方平台):为甲方提供的跨媒介跨平台跨终端广告投放平台

DMP(Data Management Platform,数

Read more

《深度学习500问》总结

1 基本信息

1.1 书籍名称:《深度学习500问》

1.2 撰写作者:众包

1.3 出版日期:在线书籍

1.4 品读时间:2023-11

1.5 整体耗时:约10h

1.6 摘要

本书系统地描述了深度学习的基本理论算法及应用.以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需

Read more

12_19《深度学习500问》训练部署

第十二章 网络搭建及训练

框架对比:Tensorflow VS Pytorch VS Caffe

第十三章 优化算法

没有免费午餐定理(No Free Lunch,简称NFL):

  • 在所有可能的问题上,没有一个算法的平均性能可以超过任何其他算法
  • 没有“免费的午餐”,不可能有一个万能的算法可以在所有问题上都表现最好
  • 优化算法本质:寻找和探索更符合数据集和问题

Read more

8_11《深度学习500问》网络进阶

第八章 目标检测

Two Stage 目标检测模型(效果好,但速度相对慢):

  • R-CNN:R-CNN系列的第一代算法,结合了传统的“计算机视觉”知识;将预训练模型(比如CNN)的隐藏层输出作为图像特征,特征输入支持向量机用于预测分类,图像特征+候选边界框输入线性回归模型用于预测真实边界框
  • Fast R-CNN:基于R-CNN和SPPnets进行的改进;1. 只对整幅图像进行一次特征提取,避免R-CNN中的冗余特征提取 2. 用RoI pooling(兴趣区域池化)层替换最后一层的max pooling层, 并引

Read more

4_7《深度学习500问》神经网络

第四章 经典网络

LeNet-5:用于识别手写数字和机器印刷字符的卷积神经网络

  • 使用卷积提取空间特征,使用映射的空间均值进行下采样
  • 使用 $tanh$ 或 $sigmoid$ 进行非线性映射(LeNet-5最重要的特性)
  • MLP 作为最终的分类器;层间的稀疏连接矩阵以避免巨大的计算开销

AlexNet:首个应用于图像分类的深层卷积神经网络

  • 在2012年 ILSVRC 图像分类竞赛中以 15.3% 的top-5测试错误率获胜
  • 所有卷积层都使用ReLU作为非线性映射函数,使模型

Read more