美文网首页
数据预处理:dplyr package sample

数据预处理:dplyr package sample

作者: MC1229 | 来源:发表于2016-08-22 01:35 被阅读63次

library(dplyr)

options(width=105)

chicago<-readRDS("chicago,rds")

dim(chicago)

str(chicago)

names(chicago)

head(select(chicago), city:dptp))  #把city到dptp之间的变量都选出来

head(select(chicago), -(city:dptp)))  #把除city到dptp之间的变量外的都选出来

#如果不用dplyr,代码是

# i<-match("city", names(chicago))

# j<-match("dptp", names(chicago))

# head(chicago[, -(i:j)])

# FILTER

chic.f <-filter(chicago, pm25tmean2>30)

chic.f <-filter(chicago, pm25tmean2>30 & tmpd>80)

head(chic.f)

# Arrange

chicago <- arrange(chicago, date)   # 从小到大排列

chicago <- arrange(chicago, desc(date))    # 从大到小排列

head(chicago); tail(chicago)

# Rename

chicago <- rename(chicago, pm25=pm25mean2, dewpoint=dptp)

# MUTATE

chicago<-mutate(chicago, pm25detrend=pm25-mean(pm25, na.rm=TRUE))

# 创造新变量

#goup_by

#此组代码目的在于求出在天气冷热的不同条件下,空气污染的均值、最高值会否有差异

chicago<-mutate(chicago, tempat=factor(1*(tmpd>80),labels=c("cold","hot")))

hotcold<-group_by(chicago, tempcat)

summarize(hotcold, pm25=mean(pm25),o3=max(o3tmean2),no2=median(no2tmean2))

summarize(hotcold, pm25=mean(pm25, na.rm=TRUE),o3=max(o3tmean2),no2=median(no2tmean2))

# 忽略pm25中的missing value

# Summarize 

#此组代码目的在于求出不同年份的数据有无差异

chicago<-mutate(chicago, year=as.POSIXlt(date)$year + 1900)

# 此方法可以简单地得到年份数据

years<-group_by(chicago, year)

summarize(years, pm25=mean(pm25, na.rm=TRUE),o3=max(o3tmean2),no2=median(no2tmean2))

# Pipeline Operation

chicago %>% mutate(month=as.POSIXlt(date)$mon + 1) %>% group_by(month) %>% summarize(pm25=mean(pm25, na.rm=TRUE),o3=max(o3tmean2),no2=median(no2tmean2))

相关文章

  • 数据预处理:dplyr package sample

    library(dplyr)options(width=105)chicago<-readRDS("chicago...

  • Day - 6 噜噜

    Learning 'dplyr' package 处理数据神器'dplyr'包 mutate() mutate(d...

  • Basic data manipulation

    R中有很多package可以支持对数据进行各种操作与变换,下面介绍几种常用的利器。 dplyr dplyr包主要是...

  • DAY 4

    参考:datacamp dplyr package 通过filter 筛选符合某种情况的数据集,多个条件可以用逗号...

  • R数据操纵:dplyr基础

    原创 R 数据分析 dplyr是 R 中最为实用的package之一,是data manipulation的一大利...

  • OkHttp总结

    package com.jimmy.sample; import android.graphics.Bitmap;...

  • R package——dplyr(一)

    dplyr作为我在日常学习生活中最常用到的包之一,是数据分析必备佳器。同时又由于其各个语法之间使用时的类似度较高,...

  • 简书文章测试

    # 立志程序眼 --- 代码测试 、、、java package org.springboot.sample.ma...

  • R_Datacamp3(2018-07-20——2018-07-

    Data Manipulation in R with dplyr用dplyr包来处理数据 Introductio...

  • R:数据处理常用包

    dplyr data.tabledplyr data.table对比dplyr参考数据处理经常用到的包dplyr...

网友评论

      本文标题:数据预处理:dplyr package sample

      本文链接:https://www.haomeiwen.com/subject/dwrwsttx.html