分类目录归档:书籍

9.《Python数据分析》绘图和可视化

本章主要围绕matplotlib和seaborn两个模块进行可视化的演示

1 matplotlib API入门

matplotlib的图像都是基于Figure对象

  • plt.figure()可以创建一个空白的新Figure
  • 通过Figure对象的属性实现对图片的调整(比如figsize控制图片大小)
  • Figure对象可以通过add_subplot创建多子图,并可以依次进行绘制
  • 直接调用绘图函数时,Figure对象等创建过程会在内部自动进行

代码示例:

import matp

Read more

8.《Python数据分析》数据的联接、合并与重塑

1 层次化索引

层次化索引(hierarchical indexing)为pandas提供了一种以低维形式处理高维数据的方法

层次化索引的简单示例:

data = pd.Series(np.random.randn(9),index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'],
    									   [1, 2, 3, 1, 3, 1, 

Read more

7.《Python数据分析》数据清洗和准备

在整个数据分析和建模的过程中,数据清洗和预处理将占据其中80%的时间

1 处理缺失数据

pandas沿用了R语言中的习惯,将缺失值表示为NA(not available)

  • Python内置的None也可以作为NA
  • 对于浮点型数据来说,也会用NaN(Not a Number)表示缺失

处理缺失的代码示例:

string_data = pd.Series(["aardvark", np.nan, None, "avocado"])
string_data.isna(

Read more

6.《Python数据分析》数据加载与存储

1 读写文本格式的数据

常见读取函数: | 函数名称 | 简单描述 | | ---------------- | ------------------------------------------------------------- | | read_csv | 从文件、URL、文件型对象中加载带分隔符的数据,默认分隔符为逗号 | | read_fwf |

Read more

5.《Python数据分析》pandas入门

pandas是后续数据清理和分析的重要工具

pandas是基于numpy构建的,但支持异构的数据(不同于numpy,pandas中不同列的类型可以是多样化的,比如日期、数值、字符串等)。pandas的功能定位可以对标Excel,但相比于Excel会更加地灵活强大

1 pandas数据结构介绍

pandas包含两个主要数据结构:Series和DataFrame

Series是一种类似于一维数组的对象,包含了列表、字典或一维numpy数组的很多特性;每个Series都是由一个名称(name)、一组index和一组values构

Read more

4.《Python数据分析》numpy基础:数组和向量计算

NumPy(Numerical Python)是Python用于数值计算的基础包

  • 内置高效的多维数组ndarray,提供快速向量计算和灵活的广播机制
  • 具备常见的数学计算函数(线性代数、傅里叶变换等)和读写数据的能力
  • 在一个连续的内存块中存储数据,节省内存并且计算效率高
  • 提供动态、易用的接口,也很方便与其他常用编程语言对接

关于广播机制可参阅1.3 广播机制

1 多维数组

ndarray数组是一个通用的同构数据多维容器,即所有元素的类型应该是相

Read more

3.《Python数据分析》Python数据结构、函数和文件

1 数据结构和序列

元组tuple,小括号定义,固定长度,不可变的Python序列对象

在Python的函数中,参数传入以及结果返回都是以元组的形式实现的

列表list,方括号定义,长度可变,内容可变的Python序列对象

常用的序列函数

  • enumerate()示例:for i, value in enumerate(tuple_or_list)
  • sort():对序列或字符串进行排序
  • zip():对多个序列进行成对地组合(最终长度取决于最短的输入序列)
  • reversed():生成器,从后向前地迭代一个序列

字典dict(重要),大括号定义,以键值对

Read more

2.《Python数据分析》Python基础、IPython与Jupyter

提示:本书定位是专注于数据处理与分析的工具书,不涉及类和面向对象编程等概念

所以作者也推荐了三本进阶书籍:《Python Cookbook》《Fluent Python》《Effective Python》

此处加一个 #待补充 方便以后提醒自己阅读这三本书

1 Python解释器

打开解释器:在终端输入python(没反应请检查一下环境变量配置)

退出解释器:输入exit()或快捷键ctrl+D

执行python脚本:python xxxxx.py

2 IPython基础

交互式编程:在终端输入ipytho

Read more

1.《Python数据分析》准备工作

前言

《利用Python进行数据分析》第一版使用python2.7,出版于2012年

本书第二版使用python3.6,编写于2016年~2017年,针对pandas库的新特征进行更新

目前的笔记依赖于第三版,编写于2022年,并对pandas库的新特征进行更新

第三版在项目上尽可能与前两版保持一致,但是在细节有一些优化;同时第三版最大的一处变化是开放了在线版本,并通过git版本控制进行持久维护,查缺补漏(给作者点个赞)。

本书中所有涉及的代码和数

Read more

《动手学深度学习》总结

1 基本信息

1.1 书籍名称### 1 什么是 Docker:《动手学深度学习》

1.2 撰写作者:阿斯顿·张,李沐等

1.3 出版日期:在线书籍

1.4 品读时间:2021年12月-2022年8月

1.5 整体耗时:约60h

2 什么是

Read more