美文网首页
喜提一次线上事故

喜提一次线上事故

作者: 小鱼notebook | 来源:发表于2018-10-22 22:35 被阅读29次

起因:

在一个异常平凡的上午,我又一次打开商业后台,想找到我所负责的项目。

因为之前商业后台给我开的权限比较大,是我负责的项目上面显示,不是我负责的项目依旧在上面显示。

这就导致两个难点:

第一:难发现

我要从若干菜单模块中,仔细查找,才能发现我所负责的项目。很多时候,因为找的时间太长,以至于我会忘记我到底要找什么。

第二:易混淆

这些项目名称类似,经常是我以为找到我所负责的项目模块,但一打开发现不是,又要重新再次进行寻找。

一想到每天都要经历上述种种情况,秉持着要提高工作效率的决心,我决定勤快一回,整理一下我的菜单列表。

在商业后台,看到了【菜单模块】这一栏,我琢磨着大概是管理菜单显示的地方,点进去一看,果然!我后台中的项目模块都在上面,最开心的是每个项目模块旁边还有删除按钮,我毫不迟疑,目光所及之处,只要不是我负责的项目统统删掉!

就听见“哒哒哒“我鼠标疯狂点击的声音,我删得是不亦乐乎,删了一大顿,但显示的项目丝毫不见减少,正好快到中午吃饭的时间了,心里想着那就吃完饭下午继续删吧!

就此,在删了50多个菜单模块后,我终于收手去吃饭了......

后果:

吃完饭,我跟同事们在外边溜达了一圈,刚悠哉悠哉地回来。

带我的芳姐姐,见我回来了,急匆匆的问我:“你的账号给谁用了?我这的菜单少了,找技术查原因,技术说谁用你的账号把咱们的菜单模块都给删了!”

我顿时感觉晴天霹雳!

一种不祥的预感涌上心头:

难道我删的是所有账号下的菜单模块?不是我商业后台账号下的菜单模块!

我弱弱地答:“完了,我可能删错了.......”

芳姐姐恍然但急切:“你都不知道哇,客户都看不见菜单了,以为系统坏了!都在微信群里问呢!”

我理了理思绪,第一反应赶紧找技术来修复!

等好不容易联系到技术,技术说这个删除本来应该设计成标记删除,但现在是物理删除,也就是删除是真的删除.....

我听后很是崩溃,忙问:“那现在应该怎样才能修复?”

技术:“那你先统计一下你删除的项目名称,我先试着修复下。”

这一下午,我就在尽力弥补这件事情所带来的影响以及惶惶不安中度过。

而技术也因为我的失误,一直在用技术手段努力将后台恢复成未被我删过的样子。

我的同事们,也因为我的失误,无法正常的进行工作。

总之,这真是一次很不好的经历,不仅给自己增加了工作量,最主要的是,还给同事们平白增添了很多麻烦。

因此,我就在思考,如何避免再出现类似的状况——员工因操作失误导致线上事故?

感悟:

我想可以从以下三个方面进行改进:

一、产品设计

1)权限设计

从这件事就能看出,产品权限的重要性。权限说是一种自由,但同时也是一种责任。

不同角色、不同等级、不同场景,权限设计的合理性要考虑的非常周全。

2)删除操作

降低因误操作所带来的不良影响。当发现数据显示异常等情况,能第一时间恢复到未操作的状态,即:在进行删除、修改等产品功能设计时,添加类似前文所说的是标记删除而不是真实的物理删除等机制。

二、培训

刚接触后台或者刚开通某种权限时,应该给新人以指导,让其了解这些功能都是做什么的,触发后会有什么样的结果。

形式可以是:共享文档、新人培训等

三、自我规避

最最重要的就是第三点了,其实前两点只能一定程度上减少这类事情的发生,但第三点,做好的话,可以完全避免这类事情的发生。

那就是当自己进行“修改”、“删除”数据等改变原有数据、状态等操作时,先问问自己:

1)是否知道这个操作所带来的确定结果(不是自己想当然的结果)

2)是否确定此时此刻必须进行这个操作(确定自己操作的正确性)

总之一句话,要为自己所做的操作:负责。

2018.10.18记

相关文章

  • 喜提一次线上事故

    起因: 在一个异常平凡的上午,我又一次打开商业后台,想找到我所负责的项目。 因为之前商业后台给我开的权限比较大,是...

  • 一次线上事故

    最近做了一个许愿活动,由于入口是在支付宝,主要针对大学生,没想到活动效果特别好,每天有将近100w pv,加上运营...

  • 记一次线上事故

    今天服务忽然炸了,log没有记录,服务一直重启导致数据库压力暴增。

  • 记一次线上'事故'处理

    记一次线上'事故'处理 今早十点左右(2019年12月23日 10:00), 项目运营反馈新版 App 有闪退问题...

  • Spring+SpringMVC+MyBatis+easyUI整

    前文提要 承接前文《一次线上Mysql数据库崩溃事故的记录》,在文章中讲到了一次线上数据库崩溃的事件记录,建议两篇...

  • Day 107 | 喜提线上网课7天

    三年级生活第107天,12月6日,周二 计划永远赶不上变化! 早上快要送儿子出门上学了,突然微信群接到通知:在家网...

  • 翻车现场:一次JVM FullGC引发的宕机事故

    这篇文章给大家聊一次线上生产系统事故的解决经历,其背后代表的是线上生产系统的 JVM FullGC 可能引发的严重...

  • tomcat cpu暴涨100% 解析

    背景:线上项目 框架Springboot ,mybatis ,dubbo 事故:cpu 暴涨100% 线上服务运行...

  • 一波三折的一天

    今天的一次线上事故产生了一些反思,在此记录一下。 事情是这样的,今天线上服务突然 redis 挂了,然后服务各种报...

  • 提车事故2

    早上八点半,4s店来接我去提车,路上一切都很顺利,阳光也特别好,到4s店看到自己等了一个多月的车,心情不知有多激动...

网友评论

      本文标题:喜提一次线上事故

      本文链接:https://www.haomeiwen.com/subject/efjezftx.html