美文网首页生信星球培训第六十三期
学习小组Day5--R语言数据结构--shujun

学习小组Day5--R语言数据结构--shujun

作者: 科研搬砖小白菜 | 来源:发表于2020-06-07 10:03 被阅读0次
先上思维导图 学习小组Day5-数据结构.png

1. 豆花给新手Tips

-R的赋值符号不是等号,而是<-
-在Console 控制台输入命令,相当于Linux的命令行
-R的代码都是带括号的,括号必须是英文的。
-显示工作路径 getwd()
-向量是由元素组成的,元素可以是数字或者字符串
-表格在R语言中改名叫数据框
-函数或者命令不会用时,百度/谷歌搜索+?read.tabl命令查看帮助,调出帮助文档
-数据类型:向量、矩阵、数组、数据框、列表

2.向量

(1)元素:数字(numeric)/字符串(charecter)等

-标量:一个元素组成的变量
-向量:多个元素组成的变量 (一个向量是一排有序排列的元素,可作为数据框中的一列)

(2)赋值:给变量定义,赋予这个变量一个数值、字符串、数据框
x<- c(1,2,3)   # 常用的向量写法,意为将x定义为由元素1,2,3组成的向量
x<- 1:10    #从1-10之间所有的整数
x<- seq(1,10,by = 0.5)   #1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2)    #1-3 重复2次

查看变量
-右侧environment处,可以发现Values和Datas
-点击Datas中的变量,1)脚本编辑器中会出现一个数据框 2)控制台下会出现View()这个函数

(3)从向量中提取元素

-根据元素位置

x[4]   #x第4个元素
x[-4]    #排除法,除了第4个元素之外剩余的元素
x[2:4]    #第2到4个元素
x[-(2:4)]   #除了第2-4个元素
x[c(1,5)]    #第1个和第5个元素

根据值

x[x==10]     # 等于10的元素
x[x>0]    # 取大于0的元素
x[x %in% c(1,2,5)]    # 存在于向量c(1,2,5)中的元素

3. 数据框

(1)读取本地数据

read.table(file = "doudou.txt",header =T)   #默认分隔符为制表符 \t 
a <- read.table(file = "doudou.txt",header =T)
read.table("doudou.txt")
b <- read.table("doudou.txt")
read.csv("doudou.txt")     # 默认分隔符是","
c <- read.csv("doudou.txt")

参数设置:
-sep = " " "," "\t" #分别以空格、逗号、制表符为分隔符
-header = "T/F" # 是否将第一行作为列命
-row.names = "" #设置行名
-col.names = "" #设置列命

将数据框赋值给a/b/c 3个变量后分别如图所示(差异明显!)

(2)设置行名和列名

colnames(X) # 查看列名
rownames(X) # 查看行名

(3)数据框的导出

write.table(X,file = "yu.txt")
参数设置:https://blog.csdn.net/qq_42937176/article/details/105537432

(4)变量的保存与重新加载

save.image(file="bioinfoplanet.RData")#保存当前所有变量
load("bioinfoplanet.RData")
save(X,file="test.RData") #保存其中一个变量
load("test.RData")

清空environment里面的所有变量后,分别load这两个文件看环境处呈现的变量,能更好的体会什么叫做保存一个变量和所有变量

(5)元素提取

- X[x,y]    #第x行第y列
- X[x,]     #第x行
- X[,y]     #第y列
- X[y]      #也是第y列
- X[a:b]      #第a列到第b列
- X[c(a,b)]   #第a列和第b列
- X$列名     #也可以提取列,可以Tab键自动补全

相关文章

网友评论

    本文标题:学习小组Day5--R语言数据结构--shujun

    本文链接:https://www.haomeiwen.com/subject/mkiqtktx.html