1.1 工具
Anaconda
Jupyter notebook入门教程https://www.cnblogs.com/nxld/p/6566380.html
python修改默认路径的方法:https://www.zhihu.com/question/31600197/answer/231277501
书籍《从零开始学Python数据分析》、《Python数据分析与数据化运营》有视频有数据有源文件
1.2 Python基础语法
Python基础教程:http://www.runoob.com/python/python-tutorial.html
Python注释用 #,多行注释用三个单引号 ''' 或者三个双引号 """ 将注释括起来
数据索引
list中读取第几个元素 list[n-1],第一位序号为0,正向索引0开始,反向索引-1开始
区间索引[A:B]从位置A到B的字符,不包含B。
例:100CNY a[-3:]取最后三位
1.3 数据分析重要包
科学计算包numpy,pandas,可视化matplotlib,seaborn,以及机器学习包sklearn
安装包pip install package
导入包 import package as …
Numpy科学计算的基础包
http://www.runoob.com/numpy/numpy-tutorial.html
支持大量的维度数组与矩阵运算
Pandas:提供用于进行结构化数据分析的二维表格型上数据结构DataFrame。Pandas包含了高级的数据结构和操作工具,它们使得Python数据分析更加快速和容易。
http://jingyan.baidu.com/season/43456?pn=0
常用方法
查看前5条记录data.head()
查看描述性统计data.describe()
检查数据情况,是否有缺失值 info()
索引方法, loc标签索引,iloc位置索引,里面只能是数字
填补缺失值fillna(),fillna(df.mean())用均值填补缺失值
删除缺失值行dropna(axis=0),列dropna(axis=1)
替换数值replace()
升序sort_index(),降序sort_index(ascending=False)
[图片]

网友评论