残差与逻辑回归的诊断
文献:Residuals and regression diagnostics: focusing on logistic regression
1.评估模型整体拟合情况
residualPlots画残差图
2.评估个别观察值
outlier离群值
在协变量中,有异常反应的观察值。比如说,年龄超过80岁且伴有循环衰竭和肾脏衰竭的患者非常容易死亡。那么具有上述特征的生存患者就是离群值。
离群值可能对模型拟合有重要影响,离群值可以用学生化残差进行检验。
leverage杠杆值
杠杆值是远离协变量模式(或回归因子空间)平均值的观察值。比如参加高考的学生多为17-20岁之间,那么76岁的应试者就具有较大的杠杆作用。杠杆值可以用帽子(cat)值来做统计描述,每一个观察值的帽子值都可以用car包中的hatvalues()获得。
influence影响值
如果某个值的删除对回归模型系数的估算会产生本质的改变,该观测值即被称为影响值。影响值可被认为是杠杆值和离群值的综合产物。库克距离是影响值的一种表示方法。
网友评论