美文网首页
Python数据分析基础--Pandas数据处理(四)

Python数据分析基础--Pandas数据处理(四)

作者: Ly3911 | 来源:发表于2020-04-29 00:06 被阅读0次

1.数据合并
记录合并
concat([dataframe1,dataframe2,...])




字段合并
X=x1+x2+x3+...



字段匹配
merge(x,y,left_on,right_on)
x 第一个数据框 y 第二个数据框 left_on第一个数据框用于匹配的列
right_on 第二个数据框用于匹配的列

df1.merge(df2,on =' ',how = ' ') 类似数据库连接
how:inner 默认取交集,outer 取并集,left左连接,right右连接
on:用于连接的字段名

2.数据计算


简单计算

数据标准化
(1)min_max标准化:离差标准化,对原始数据线性转化
X=(x-min)/(max-min)


min_max标准化

(2)Z-score标准化:最大值、最小值未知情况,利用原始数据的均值和标准差,经过处理的数据符合标准正态分布 X=(x-均值)/标准差


Z-score标准化

3.数据分组
根据数据的特征,安装一定规律,把数据划分为不同区间分析,以揭示内在联系和规律;简单来说,就是新增一列,将原来数据按照其性质归入新类别中。
cut(series,bins,right=True,labels=null)
series表示需要分组的数据,bins表示分组的依据数据,right表示分组的时候右边是否闭合,labels表示分组的自定义标签;



4.日期处理
日期转换:字符型日期格式转换成标准日期格式
to_datetime(dateString,format)
format格式:%Y,%m,%d,%H,%M,%S



日期格式化:日期型数据转化成字符型
datetime.strftime(x,format)


日期抽取
data_dt.dt.property
property:second,minute,hour,day,mouth,year,weekday


apply方法
当希望将函数f应用到Dataframe对象的行/列,可以使用DataFrame.apply(f,axis=0,args=0,**kwds),axis=0按列运算,axis=1按行运算;


相关文章

网友评论

      本文标题:Python数据分析基础--Pandas数据处理(四)

      本文链接:https://www.haomeiwen.com/subject/wtcvbhtx.html