Pandas

作者: 闫_锋 | 来源:发表于2018-05-17 15:46 被阅读50次

提供高性能易用数据类型和分析工具

1)便于操作数据的数据类型
Series, DataFrame

2)分析函数和分析工具
基本操作,运算操作,特征类操作,关联类操作

数据分析容易

import pandas as pd
3.png

Series类型由一组数据及与之相关的数据索引组成。

列表

import pandas as pd
a = pd.Series([9, 8, 7, 6])
b = pd.Series([9, 8, 7, 6], index=['a', 'b', 'c', 'd'])

Series类型可以由如下类型创建
Python列表
标量值
Python字典
ndarray
其他函数

标量

s = pd.Series(25, index=['a', 'b', 'c'])

字典

d = pd.Series({'a':9, 'b':8, 'c':7})
e = pd.Series({'a':9, 'b':8, 'c': 7}, index = ['c', 'a', 'b', 'd'])

ndarray

import pandas as pd
import numpy as np

n = pd.Series(np.arange(5))
n = pd.Series(np.arange(5), index = np.arange(9, 4, -1))

Series类型包括index和values两部分
Series类型的操作类似ndarray类型
Series类型的操作类似Python字典类型

b = pd.Series([9, 8, 7, 6], ['a', 'b', 'c', 'd'])
b.index
b.values

Series是一维带'标签‘数组
Series基本操作类似ndarray和字典,根据索引对齐

DataFrame类型
二维数据类型,表格类型,每列值类型可以不同。
DataFrame类型由共用相同索引的一组列组成
DataFrame既有行索引,也有列索引。
DataFrame常用于表达二维数据,但可以表达多维数据。

创建:

  • 二维ndarray对象
  • 由一维ndarray, 列表,字典,元祖或Series构成的字典
  • Series类型
  • 其他的DataFrame类型

二维ndarray对象

d = pd.DataFrame(np.arange(10).reshape(2,5))

从一维ndarray对象字典创建

dt = {'one': pd.Series([1,2,3], index=['a','b','c']),
      'two': pd.Series([9, 8, 7, 6], index = ['a','b','c','d'])}

DataFrame类型
DataFrame是二维带'标签'数组。
横向index
纵向column
DataFrame基本操作类似Series,依据行列索引。

相关文章

网友评论

    本文标题:Pandas

    本文链接:https://www.haomeiwen.com/subject/ripbdftx.html