美文网首页生信分析过程中的一些小trick
明明就是整数啊你怎么说不是呢!

明明就是整数啊你怎么说不是呢!

作者: 小洁忘了怎么分身 | 来源:发表于2021-01-05 19:05 被阅读0次

1.问题

今天学员用counts表达矩阵去做差异分析,被Deseq2报错说不是整数,如图:

load("/Users/kingjie/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9/cba1c03b41421535c22ef54da2fc8c18/Message/MessageTemp/2d980b89abf205158eee86824e0a312e/File/TCGA-HNSC_gdc.Rdata")
exp[1:4,1:4]
##                    TCGA-BB-4224-01A
## ENSG00000000003.13             2237
## ENSG00000000419.11             1606
## ENSG00000000457.12             1063
## ENSG00000000460.15             1208
##                    TCGA-H7-7774-01A
## ENSG00000000003.13             2740
## ENSG00000000419.11             1691
## ENSG00000000457.12              803
## ENSG00000000460.15              317
##                    TCGA-CV-6943-01A
## ENSG00000000003.13             2686
## ENSG00000000419.11             1649
## ENSG00000000457.12              917
## ENSG00000000460.15              402
##                    TCGA-CN-5374-01A
## ENSG00000000003.13             2086
## ENSG00000000419.11             2333
## ENSG00000000457.12             1288
## ENSG00000000460.15             1105
class(exp)
## [1] "matrix" "array"
class(exp[1,1])
## [1] "numeric"

明明就是一个看起来挺正常的counts矩阵!然而:

library(DESeq2)
colData <- data.frame(row.names =colnames(exp), 
                      condition=Group)
if(!file.exists(paste0(cancer_type,"_dd.Rdata"))){
  dds <- DESeqDataSetFromMatrix(
    countData = exp,
    colData = colData,
    design = ~ condition)
  dds <- DESeq(dds)
  save(dds,file = paste0(cancer_type,"_dd.Rdata"))
}

报错信息说有一些数值它不是整数,于是学员过来求助。

2.解决方案

我给的解决方案是apply套上as.integer,矩阵变成整数型再做差异分析

exp2 = apply(exp, 2, as.integer)
library(DESeq2)
colData <- data.frame(row.names =colnames(exp2), 
                      condition=Group)
if(!file.exists(paste0(cancer_type,"_dd.Rdata"))){
  dds <- DESeqDataSetFromMatrix(
    countData = exp2,
    colData = colData,
    design = ~ condition)
  dds <- DESeq(dds)
  save(dds,file = paste0(cancer_type,"_dd.Rdata"))
}

搞定!

3.研究一下为啥子

我猜呢,是表达矩阵里面有些小数,所以检查一下数据里是不是有小数点

library(stringr)
k = str_detect(exp,"\\.");table(k)
## k
##    FALSE     TRUE 
## 13332434    61492

确实是有的,那么提取几个出来看看

x = head(exp[k]);x
## [1] 8903  947 9114 9451 9157  876

我以为见鬼了呢!这明明就是整数,哪里有小数点啊!

x
## [1] 8903  947 9114 9451 9157  876
class(x)
## [1] "numeric"

最后的破案还是来自于尝试:

as.character(x)
## [1] "8903.00000000001" "946.999999999999"
## [3] "9113.99999999999" "9451.00000000001"
## [5] "9156.99999999999" "875.999999999999"

好吧,确实是小数,只不过太接近于整数,所以被R语言显示成了整数,真是坑你没商量哦

继续刨根问底儿,得知她的表达矩阵是从xena下载的,xena 的counts数据被取了log2(count+1),这个操作可逆的 ,2^exp + 1即可。但做deseq2差异分析还需要加上一步exp2 = apply(exp, 2, as.integer)

补充一个不太重要的小知识

R语言中的numeric是数据类型的一种,它又分integer和double
,默认都是double,如果想明确指定要integer可在写代码时加L或者用as.integer转换。

class(1)
[1] "numeric"
class(1L)
[1] "integer"
typeof(1)
[1] "double"
typeof(1L)
[1] "integer"

相关文章

  • 明明就是整数啊你怎么说不是呢!

    1.问题 今天学员用counts表达矩阵去做差异分析,被Deseq2报错说不是整数,如图: 明明就是一个看起来挺正...

  • 缘来还是你

    “什么啊?人家明明都是纯洁的友谊,老哥!你弄错了!” “傻傻傻玲子啊,他他他俩明明就是有意思嘛,怎…怎么能不是呢?...

  • 同样在努力,为什么幸运的不是你?

    你是不是有这种感觉~~明明在努力学习,却总是不见成效?明明我工作很用心啊,为什么上司就是看不见呢?明明自己很有能...

  • 成为你自己,愿你承认自己!

    今天的话题很有趣,是“成为你自己”,明明我就是我自己,怎么说还要成为我自己呢?其实,我也很奇。 ...

  • L.U.V

    Time with you is not wasted time. 首尔的天气最近很不稳定,怎么说呢,大概就是明明...

  • 2/17

    明明17号蹲在马桶上看的书,结果拖到现在才打卡……罪过啊罪过……都没有把阅读计划连续起来……毅力啊…… 怎么说呢,...

  • 深夜的女人

    “这天,变了呢” “是啊,变冷了” 初春的风不是秋天的凉爽,是过往寒冬的冷漠。明明就是没有过完冬天,时节却告诉你春...

  • 打游戏之体验——生气!

    就在30秒之前,我刚刚从王者峡谷里遨游出来,真的有点生气! 啧……怎么说呢,明明你就是玩个阴人的英...

  • 521,温暖你

    很久之前,我就很好奇 为什么是520, 不是521呢? 0, 你 1, 你 明明“1”更像“你”啊 想想在...

  • 生存下来12。

    我说不是你有病啊,你是不是没吃药?他说你还不是你怎么说话呢?你给我好好说话,我这次来是给你送一只鸭子,你那么说话我...

网友评论

    本文标题:明明就是整数啊你怎么说不是呢!

    本文链接:https://www.haomeiwen.com/subject/yymwoktx.html