提供高性能易用数据类型和分析工具
1)便于操作数据的数据类型
Series, DataFrame
2)分析函数和分析工具
基本操作,运算操作,特征类操作,关联类操作
数据分析容易
import pandas as pd

Series类型由一组数据及与之相关的数据索引组成。
列表
import pandas as pd
a = pd.Series([9, 8, 7, 6])
b = pd.Series([9, 8, 7, 6], index=['a', 'b', 'c', 'd'])
Series类型可以由如下类型创建
Python列表
标量值
Python字典
ndarray
其他函数
标量
s = pd.Series(25, index=['a', 'b', 'c'])
字典
d = pd.Series({'a':9, 'b':8, 'c':7})
e = pd.Series({'a':9, 'b':8, 'c': 7}, index = ['c', 'a', 'b', 'd'])
ndarray
import pandas as pd
import numpy as np
n = pd.Series(np.arange(5))
n = pd.Series(np.arange(5), index = np.arange(9, 4, -1))
Series类型包括index和values两部分
Series类型的操作类似ndarray类型
Series类型的操作类似Python字典类型
b = pd.Series([9, 8, 7, 6], ['a', 'b', 'c', 'd'])
b.index
b.values
Series是一维带'标签‘数组
Series基本操作类似ndarray和字典,根据索引对齐
DataFrame类型
二维数据类型,表格类型,每列值类型可以不同。
DataFrame类型由共用相同索引的一组列组成
DataFrame既有行索引,也有列索引。
DataFrame常用于表达二维数据,但可以表达多维数据。
创建:
- 二维ndarray对象
- 由一维ndarray, 列表,字典,元祖或Series构成的字典
- Series类型
- 其他的DataFrame类型
二维ndarray对象
d = pd.DataFrame(np.arange(10).reshape(2,5))
从一维ndarray对象字典创建
dt = {'one': pd.Series([1,2,3], index=['a','b','c']),
'two': pd.Series([9, 8, 7, 6], index = ['a','b','c','d'])}
DataFrame类型
DataFrame是二维带'标签'数组。
横向index
纵向column
DataFrame基本操作类似Series,依据行列索引。
网友评论