更新时间:2025-03-18 19:12:10
封面
版权信息
前言
1 Python简介与安装
1.1 Python的优点
1.2 Python的安装与配置
1.2.1 Windows系统下的安装与配置
1.2.2 Mac系统下的安装与配置
1.2.3 Linux系统下的安装与配置
1.3 Anaconda的使用方法
1.3.1 打开命令行终端
1.3.2 更新软件下载渠道
1.3.3 创建conda虚拟环境
1.3.4 安装软件库
1.3.5 conda常用命令合集
1.4 Jupyter Notebook
1.4.1 打开Jupyter Notebook
1.4.2 Jupyter Notebook界面
2 Python语言基础与重要的库
2.1 Python快速入门
2.1.1 第一个Python程序
2.1.2 Python的缩进
2.1.3 查询帮助文件
2.1.4 Tab键自动补全代码
2.2 Python语法基础
2.2.1 变量和数据类型
2.2.2 运算符
2.2.3 列表、元组和字典
2.2.4 函数
2.3 重要的Python库
3 数据集创建
3.1 NumPy多维数组对象
3.1.1 NumPy数组属性
3.1.2 NumPy数组创建
3.1.3 NumPy切片和索引
3.2 Pandas数据结构
3.2.1 Series(一维数据)
3.2.2 DataFrame(二维数据)
3.2.3 NumPy与Pandas转换
3.3 数据取值与选择
3.3.1 Series(一维数据)
3.3.2 DataFrame(二维数据)
3.4 数据读取与存储
3.4.1 Pandas读取Excel数据
3.4.2 Pandas读取CSV文件
3.4.3 Pandas读取Txt数据
3.4.4 Pandas读取SAS、Stata和SPSS数据
3.4.5 存储数据
4 基本数据管理
4.1 数据基本信息与结构查看
4.2 创建新变量
4.3 变量重命名
4.4 数据类型转换
4.4.1 基本数据类型转换
4.4.2 时间日期数据类型转换
4.5 数据排序
4.5.1 按索引标签排序
4.5.2 按列值排序
4.6 缺失值处理
4.6.1 缺失值判断
4.6.2 缺失值删除
4.7 缺失数据填补
4.8 重复数据处理
4.9 数据集的合并
4.9.1 merge()方法
4.9.2 concat()方法
4.9.3 join()方法
4.10 数据集取子集
4.10.1 直接选择
4.10.2 loc()函数选取子集
4.10.3 iloc()函数选取子集
4.11 数据分组
4.11.1 groupby()函数
4.11.2 cut()和qcut()函数
4.12 melt()函数
4.13 数据集更新
4.13.1 replace()函数
4.13.2 update()函数
4.14 数据集比较
5 高级数据管理
5.1 控制流
5.1.1 条件(分支)语句
5.1.2 循环结构
5.2 函数
5.2.1 pandas函数
5.2.2 lambda函数
5.3 向量化字符串操作
5.4 正则表达式
6 网络数据采集
6.1 初识爬虫
6.2 http协议与url
6.2.1 http请求
6.2.2 http响应
6.3 网页结构
6.3.1 HTML标签
6.3.2 HTML属性
6.4 Requests库
6.4.1 获取网页
6.4.2 POST请求
6.5 BeautifulSoup库