1 基本介绍
hyperopt通过在超参空间内快速搜索,寻找最优的模型超参
- 目前已实现搜索算法:随机搜索、TPE和自适应TPE
- 低代码,易上手;支持分布式运算
注意:虽然该项目有6.6k个⭐,但已经有一年半未更新
截至撰写本文的230315,此项目的上次更新日期是211129
补充说明:对tpe算法原理感兴趣的读者可参阅论文阅读-TPE算法
2 简单上手
- 最简单的官方示例:
# 定义目标函数
def objective(args): # objective = c1+c2^2
分类目录归档:Python
PyCaret是一个开源的、低代码的Python机器学习库,可以实现机器学习工作流程的自动化。作为一个端到端的机器学习和模型管理工具,PyCaret可以成倍地缩短实验周期,实现更有效率的科研探索。
TableOne是一个很简单实用的小工具,能对数据进行基本统计展示
基本特性:
使用注意事项:
categorical
显式指定得益于强大的pandas模块,与数据框的结构更贴近的表格文件是Python中最流行的数据文件存储格式之一。对应的存储文件一般后缀为.CSV或.XLSX
SHAP (SHapley Additive explanation)是一种解释任何机器学习模型输出的博弈论方法
SHAP库的特性:
Pandas 中的操作有时会返回数据的视图(View),有时会返回数据的副本(Copy)
在视图上的修改会影响原始数据,而在副本上的修改不会影响原始数据。因此在链式赋值等场景下,pandas可能报出SettingWithCopyWarning
的警告,这类警告通常意味着程序并不知道赋值过程是否成功,因此是值得重视的
SettingWithCopyWarning
的解决方案:
data.loc[data.bidder =
本文内容主要摘自:
《Is something better than pandas when the dataset fits the memory?》
代码地址
性能对比主要围绕5个操作展开:
轻量级Python文件性能查看器
安装:pip install tuna
用法1:运行性能分析
python -mcProfile -o program.prof yourfile.py
tuna program.prof
用法2:模块导入性能
python -X importtime yourfile.py 2> import.log
#简写方法
python3 -X importtime -c "import