美文网首页
[python][科学计算][numpy]使用指南2-创建

[python][科学计算][numpy]使用指南2-创建

作者: jiedawang | 来源:发表于2019-02-24 20:50 被阅读0次

最后一次更新日期: 2019/3/7

NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象(ndarray)和用于处理数组的例程集合组成的库。
使用NumPy,开发人员可以执行以下操作:

  • 数组的算数和逻辑运算。
  • 傅立叶变换和用于图形操作的例程。
  • 与线性代数有关的操作。 NumPy 拥有线性代数和随机数生成的内置函数。

使用前先导入模块:
import numpy as np

1. 从已有数据创建

(1). 从list创建
#一维数组
a1=np.array([1,2])
#二维数组
a2=np.array([[1.,2.],[3.,4.]])
#三维数组
a3=np.array([[[1,2],[3,4]],[[5,6],[7,8]]],dtype='float')
#以此类推

从嵌套的序列结构创建多维数组时,最外面的一层对应数组第一个轴,以此类推。
第二个参数dtype可以显式声明数组的数据类型,可传入dtypetype(python基础数据类型或numpy数据类型)或与dtype对应的字符串标识,不声明的情况下会根据传入数据自动采用最合适的数据类型。

(2). 从tuple创建
a=np.array((1,2))

list是一样,listtuple的嵌套同理。

(3). 从dict创建(不合适)
In [138]: np.array({"x1":1,"x2":2})
Out[138]: array({'x1': 1, 'x2': 2}, dtype=object)

无法正常转换,整个dict会作为一个对象存入数组,可以尝试用pandas库去处理。

(4). 从其他类数组结构中创建,如PIL的图片类型
from PIL import Image
image= Image.open("D:\\test.jpg")
a=np.asarray(image)

np.asarray在多数情况下与np.array等效,区别在于np.asarray会避免没有必要的重复创建,当数据源同样是ndarraydtype无变化时,不会返回新的数组。

2. 快速填充

(1). 0/1填充
#填充0
a1=np.zeros((2,2))
#填充1
a2=np.ones((2,2))
#声明类型
a2=np.ones((2,2),dtype='int')

第一个参数shape为数组形状,必须赋值;
默认数据类型为float64,可通过dtype参数指定类型。

(2). 对角矩阵
In [151]: np.eye(3,3,0)
Out[151]: 
array([[ 1.,  0.,  0.],
       [ 0.,  1.,  0.],
       [ 0.,  0.,  1.]])

In [150]: np.eye(3,3,1)
Out[150]: 
array([[ 0.,  1.,  0.],
       [ 0.,  0.,  1.],
       [ 0.,  0.,  0.]])

第一个参数N为0轴长度,必须赋值;
第二个参数M为1轴长度,不赋值时与N值一致;
第一个参数k为对角线偏移量,默认0,正数向上偏移,负数向下偏移。
对角矩阵固定为二维数组。

(3).单位矩阵
In [5]: np.identity(1)
Out[5]: array([[ 1.]])

In [6]: np.identity(2)
Out[6]: 
array([[ 1.,  0.],
       [ 0.,  1.]])

第一个参数n为统一的轴长度,必须赋值;
单位矩阵固定为二维数组。

(4). 指定值填充
a=np.full((2,2),'a')

第一个参数shape为数组形状,必须赋值;
第二个参数fill_value为填充值,必须赋值。

(5). 空值填充
a=np.empty((2,2))

第一个参数shape为数组形状,必须赋值。
创建一个数组,但不初始化其中的值。

(6). 参考已有数组形状创建
a=np.ones((2,2))
a2=np.zeros_like(a)
a3=np.full_like(a,'a')
(7). 等差数列
#方法一
a1=np.arange(0,100,1)
#方法二
a2=np.linspace(0,99,100)

方法一,类似range函数,默认int类型,
三个参数分别为:开始,结束,步长(区间前闭后开);
方法二,线性空间,默认float类型,
range不一样,结束值默认是包含于区间的,
且第三个参数不是步长而是元素个数。

(8). 随机数
浮点数随机数
#[0,1]浮点随机数
a1=np.random.rand(5,5)
#标准正太分布随机数
a2=np.random.randn(5,5)

需要注意的是,上面的方法不通过shape而通过全部参数来定义数组形状。

整数随机数
#产生指定范围的整数随机数
a=np.random.randint(0,10,(4,3))

第一个参数low表示区间下限,必须赋值;
第二个参数high表示区间上限,未赋值时会将low作为上限,0作为下限;
第三个参数size表示数组形状,未赋值时函数会返回标量值。

正态分布随机数
a=np.random.normal(100,10,(4,3))

第一个参数loc表示分布的平均值;
第二个参数scale表示分布的标准偏差;
第三个参数size表示数组形状,未赋值时函数会返回标量值。

均匀分布随机数
a=np.random.uniform(0,10,(4,3))

第一个参数low表示区间下限,必须赋值;
第二个参数high表示区间上限,未赋值时会将low作为上限,0作为下限;
第三个参数size表示数组形状,未赋值时函数会返回标量值。

泊松分布随机数
a=np.random.poisson(1.0,(4,3))

第一个参数lam是lambda系数;
第二个参数size表示数组形状,未赋值时函数会返回标量值。

(9). 网格数据
In [26]: X,Y=np.mgrid[1:2:2j,1:3:3j]

In [27]: X
Out[27]: 
array([[ 1.,  1.,  1.],
       [ 2.,  2.,  2.]])

In [28]: Y
Out[28]: 
array([[ 1.,  2.,  3.],
       [ 1.,  2.,  3.]])

In [33]: x=np.array([1,2,3])

In [34]: y=np.array([1,2])

In [35]: X,Y=np.meshgrid(x,y)

In [36]: X
Out[36]: 
array([[1, 2, 3],
       [1, 2, 3]])

In [37]: Y
Out[37]: 
array([[1, 1, 1],
       [2, 2, 2]])

np.mgrid通过索引选取的方式直接获得网格数据,j表示步数且包含停止值,去掉j该项代表步长且不包含停止值,第一个索引位声明X在轴0方向上的增长,第二个索引位声明Y在轴1方向上的增长,然后将XY广播至相同大小,存在更多索引位时以此类推。
np.meshgrid在已有数据基础上构造网格数据,跟mgrid不一样,第一个参数是表示第二个轴方向上增长的向量,第二个参数对应第一个轴,第三个参数对应第三个轴,第四个参数对应第四个轴,之后以此类推。
网格数据常用于绘图。

(10). 复制
a1=np.zeros((2,2))
a2=np.copy(a1)

相关文章

网友评论

      本文标题:[python][科学计算][numpy]使用指南2-创建

      本文链接:https://www.haomeiwen.com/subject/ruobyqtx.html