这次事件持续时间从凌晨2点多,到早上11点多才搞定,已经是个大故障了。
虽说林阳定位问题到了第二天凌晨,但是因为临时解决了所以问题还不至于那么严重。如果真的是到了第二天凌晨才解决,不说林阳了,连朱志方估计都自身难保。
这次的复盘会规格比较高,各事业群的领导和骨干也都参加。因为在公共事业部的引领下,公司把APS作为一个重点技术已经应用到各个事业群,而林阳所在的公共事业部是先驱,是引领者。
这次复盘会比较有意思,原来有一些事业群不太想用新技术这次也是来看朱志方和林阳的笑话。当前推广APS时,朱志方和林阳有多风光,现在就有多难堪。
好在这次事故是APS技术本身的bug导致的,在业内已经广泛使用APS技术的情况下,目前还没有人遇到,至少没听说过。所以,林阳这次也是一个趟雷者,在遇到一个从未有过的问题时,能处理到这种程度,也算说的过去。
不过,说的再好听还是林阳这边的责任,你运气不好遇到了,没有快速定位到问题,说明学艺不精。当时对外部的宣讲时,明发科技可是号称国内APS的第一家,要是这事传出去也不太光彩。
复盘会上,李元真副总裁先把这次事故的影响面说了下,当然少不了批评朱志方和林阳。中间林阳把前因后果和处置手段都介绍了下,李元真看了之后内心也觉着处置的还挺好,虽说影响面比较大,但是处置得当。但明面上,这么大的事故,肯定得对老总有交待,定责是少不了的。
李元真根据这次事故的根因让各事业群使用APS技术的人抓紧时间自查,以防出现同样的问题。这有什么好自查的,林阳确信公司上下,甚至国内估计都没有人改过这块代码逻辑。
后面几个事业群APS技术的负责人当然都来请教林阳具体的改进方案,林阳当然倾囊相授,如果不给哪天出了同样的问题,帽子不得戴到自己头上。
这次事故定责,朱志方负领导责任,跑不了,不过是个轻微的记过。具体运维部如何定责,朱志方让林阳定个方案。
林阳明白朱志方是想让自己找个背锅的,如果真的是人为故障,林阳也不会随便替人背锅。但这次故障是谁都没想到的,林阳也不想让手下背锅,当领导吗,总得担点责任。那朱老大不是也受到处罚了,自己不能躲在后面,要不然就和自己以前一样,令人寒心。
于是,林阳把这次事故的主要责任加到了自己头上,朱志方看林阳这么决定的,也没说什么。
事后,林阳在部门内部开了全员会,重点把事情前因后果总结了下,分析了下这里面哪些处置是对的,哪些处置应该优化,以及如何提升定位问题的效率等,林阳并没有追究谁的责任。
大家知道林阳把责任扛了起来,对有林阳这样负责的领导也是心满意足,私底下默默给林阳点赞。