1 背景知识
本文内容主要摘自:
《Is something better than pandas when the dataset fits the memory?》
代码地址
性能对比主要围绕5个操作展开:
- 读取700M CSV文件:load_transactions
- 读取30M CSV文件:load_identity
- 基于某列(string格式)进行merge操作:merge
- 分别对六列数据进行聚合操作(s
分类目录归档:Python 性能优化
本文内容主要摘自:
《Is something better than pandas when the dataset fits the memory?》
代码地址
性能对比主要围绕5个操作展开: