最后一次更新日期: 2019/3/7
NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象(ndarray)和用于处理数组的例程集合组成的库。
使用NumPy,开发人员可以执行以下操作:
- 数组的算数和逻辑运算。
- 傅立叶变换和用于图形操作的例程。
- 与线性代数有关的操作。 NumPy 拥有线性代数和随机数生成的内置函数。
使用前先导入模块:
import numpy as np
1. 从已有数据创建
(1). 从list创建
#一维数组
a1=np.array([1,2])
#二维数组
a2=np.array([[1.,2.],[3.,4.]])
#三维数组
a3=np.array([[[1,2],[3,4]],[[5,6],[7,8]]],dtype='float')
#以此类推
从嵌套的序列结构创建多维数组时,最外面的一层对应数组第一个轴,以此类推。
第二个参数dtype
可以显式声明数组的数据类型,可传入dtype
或type
(python基础数据类型或numpy数据类型)或与dtype
对应的字符串标识,不声明的情况下会根据传入数据自动采用最合适的数据类型。
(2). 从tuple创建
a=np.array((1,2))
与list
是一样,list
与tuple
的嵌套同理。
(3). 从dict创建(不合适)
In [138]: np.array({"x1":1,"x2":2})
Out[138]: array({'x1': 1, 'x2': 2}, dtype=object)
无法正常转换,整个dict
会作为一个对象存入数组,可以尝试用pandas库去处理。
(4). 从其他类数组结构中创建,如PIL的图片类型
from PIL import Image
image= Image.open("D:\\test.jpg")
a=np.asarray(image)
np.asarray
在多数情况下与np.array
等效,区别在于np.asarray
会避免没有必要的重复创建,当数据源同样是ndarray
且dtype
无变化时,不会返回新的数组。
2. 快速填充
(1). 0/1填充
#填充0
a1=np.zeros((2,2))
#填充1
a2=np.ones((2,2))
#声明类型
a2=np.ones((2,2),dtype='int')
第一个参数shape
为数组形状,必须赋值;
默认数据类型为float64
,可通过dtype
参数指定类型。
(2). 对角矩阵
In [151]: np.eye(3,3,0)
Out[151]:
array([[ 1., 0., 0.],
[ 0., 1., 0.],
[ 0., 0., 1.]])
In [150]: np.eye(3,3,1)
Out[150]:
array([[ 0., 1., 0.],
[ 0., 0., 1.],
[ 0., 0., 0.]])
第一个参数N
为0轴长度,必须赋值;
第二个参数M
为1轴长度,不赋值时与N
值一致;
第一个参数k
为对角线偏移量,默认0,正数向上偏移,负数向下偏移。
对角矩阵固定为二维数组。
(3).单位矩阵
In [5]: np.identity(1)
Out[5]: array([[ 1.]])
In [6]: np.identity(2)
Out[6]:
array([[ 1., 0.],
[ 0., 1.]])
第一个参数n
为统一的轴长度,必须赋值;
单位矩阵固定为二维数组。
(4). 指定值填充
a=np.full((2,2),'a')
第一个参数shape
为数组形状,必须赋值;
第二个参数fill_value
为填充值,必须赋值。
(5). 空值填充
a=np.empty((2,2))
第一个参数shape
为数组形状,必须赋值。
创建一个数组,但不初始化其中的值。
(6). 参考已有数组形状创建
a=np.ones((2,2))
a2=np.zeros_like(a)
a3=np.full_like(a,'a')
(7). 等差数列
#方法一
a1=np.arange(0,100,1)
#方法二
a2=np.linspace(0,99,100)
方法一,类似range
函数,默认int
类型,
三个参数分别为:开始,结束,步长(区间前闭后开);
方法二,线性空间,默认float
类型,
和range
不一样,结束值默认是包含于区间的,
且第三个参数不是步长而是元素个数。
(8). 随机数
浮点数随机数
#[0,1]浮点随机数
a1=np.random.rand(5,5)
#标准正太分布随机数
a2=np.random.randn(5,5)
需要注意的是,上面的方法不通过shape
而通过全部参数来定义数组形状。
整数随机数
#产生指定范围的整数随机数
a=np.random.randint(0,10,(4,3))
第一个参数low
表示区间下限,必须赋值;
第二个参数high
表示区间上限,未赋值时会将low
作为上限,0作为下限;
第三个参数size
表示数组形状,未赋值时函数会返回标量值。
正态分布随机数
a=np.random.normal(100,10,(4,3))
第一个参数loc
表示分布的平均值;
第二个参数scale
表示分布的标准偏差;
第三个参数size
表示数组形状,未赋值时函数会返回标量值。
均匀分布随机数
a=np.random.uniform(0,10,(4,3))
第一个参数low
表示区间下限,必须赋值;
第二个参数high
表示区间上限,未赋值时会将low
作为上限,0作为下限;
第三个参数size
表示数组形状,未赋值时函数会返回标量值。
泊松分布随机数
a=np.random.poisson(1.0,(4,3))
第一个参数lam
是lambda系数;
第二个参数size
表示数组形状,未赋值时函数会返回标量值。
(9). 网格数据
In [26]: X,Y=np.mgrid[1:2:2j,1:3:3j]
In [27]: X
Out[27]:
array([[ 1., 1., 1.],
[ 2., 2., 2.]])
In [28]: Y
Out[28]:
array([[ 1., 2., 3.],
[ 1., 2., 3.]])
In [33]: x=np.array([1,2,3])
In [34]: y=np.array([1,2])
In [35]: X,Y=np.meshgrid(x,y)
In [36]: X
Out[36]:
array([[1, 2, 3],
[1, 2, 3]])
In [37]: Y
Out[37]:
array([[1, 1, 1],
[2, 2, 2]])
np.mgrid
通过索引选取的方式直接获得网格数据,j
表示步数且包含停止值,去掉j
该项代表步长且不包含停止值,第一个索引位声明X
在轴0方向上的增长,第二个索引位声明Y
在轴1方向上的增长,然后将X
和Y
广播至相同大小,存在更多索引位时以此类推。
np.meshgrid
在已有数据基础上构造网格数据,跟mgrid
不一样,第一个参数是表示第二个轴方向上增长的向量,第二个参数对应第一个轴,第三个参数对应第三个轴,第四个参数对应第四个轴,之后以此类推。
网格数据常用于绘图。
(10). 复制
a1=np.zeros((2,2))
a2=np.copy(a1)
网友评论