R - 看数据概况

作者: XuXiaolu | 来源:发表于2018-08-24 15:14 被阅读1次

整体的描述性统计量

1. summary()函数可以获取描述性统计量
可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计
2. misc包中的describe()函数
可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值
3. psych包中的describe()函数
psych包也拥有一个名为describe()的函数,它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误
4. pastecs包中的stat.desc()的函数
可以计算种类繁多的描述性统计量。使用格式为:stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95)
其中的x是一个数据框或时间序列。
若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。
若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。
最后,若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果
5. str()函数
以简洁的方式显示对象的数据结构及内容,可以查看数据框中每个变量的属性
6. attributes()函数
可以提取对象除长度和模式以外的各种属性

各组的描述性统计信息

7. aggregate()函数
仅允许在每次调用中使用平均数、标准差这样的单返回值函数,它无法一次返回若干个统计量
8. by()函数
格式为:by(data,INDICES,FUN),其中data是一个数据框或矩阵,INDICES是一个因子或因子组成的列表,定义了分组,FUN是任意函数。
9. doBy包中的summaryBy()函数
10. psych包中的describe.by()函数

比较两个数据集不同的Column Name

# 方法1
names(cprv_tongyong [, !pmatch(names(cprv_tongyong),names(cprv_tongyong_all),0)])
# 方法2 
names(cprv_tongyong [, !match(names(cprv_tongyong),names(cprv_tongyong_all),0)])
# 方法3
names(car_data_58_all[,!names(car_data_58_all) %in% names(car_data_58)])
# 方法4
car_data_58_diff <-car_data_58_all[which( car_data_58$id %in% car_data_58_all$id),]

如果结果是:character(0) , 是数据集关系写反了。

比较两个字符串不同的内容

 cc[!cc %in% xc]  # 字符串

相关文章

  • R - 看数据概况

    整体的描述性统计量 1. summary()函数可以获取描述性统计量可以提供最小值、最大值、四分位数和数值型变量的...

  • 学习小组Day 6,7 - Zac

    1. R的基本数据管理 2. 测序概况 一二三代测序的对比

  • 数据挖掘概况

    一、数据挖掘的定义 数据挖掘(Data mining,简称DM),是指从大量的数据中,通过统计人工智能,机器学习等...

  • Python数据分析入门

    python与数据分析概况 数据分析概况 数据分析,是指用适当的分析方法,对收集的数据进行分析,总结规律,提取有价...

  • 英语学习022-32412

    重点词汇 overview 美 [ˈoʊvərvjuː] 概述、概览、概况 birthplace美[ˈbɜːr...

  • 学习小组Day4笔记--lqp

    R语言基础 概况 1.免费,开源 2.程序设计语言 3.完善的数据类型 4.经典的、现代的统计方法 5.支持复杂算...

  • 青否小程序智慧门店操作手册

    后台操作 1. 数据 1.1 数据概况:显示小程序今日实时、昨日概况、近7日交易趋势等信息,方便及时了解门店信息。...

  • R:绘制临床三线表

    R 表格速成 R数据处理能力非常强大,而且输出也非常灵活。当然在R里面的输出都是print字符形式,我们在R里面看...

  • 数据结构概况

    课程链接:https://time.geekbang.org/column/article/40011 【强烈推荐...

  • 微信把这个功能推出来后,谁又该慌了!!!

    微信公众号后台截图 “品牌搜索”包括品牌官方区、官方主页、数据概况。其中,数据概况里可以查看品牌微信指数、官方主页...

网友评论

    本文标题:R - 看数据概况

    本文链接:https://www.haomeiwen.com/subject/ddobiftx.html