是时候重新思考灾难恢复

作者:David Lane

1995年4月19日,蒂莫西·麦克维和同伙摧毁了俄克拉荷马州俄克拉荷马城的默拉联邦大楼。这是迄今为止美国内战以来最严重的恐怖主义事件。在那一天,许多事情发生了变化,但最重要的教训并没有被很好地吸取。

2001年9月11日,基地组织将飞机撞向纽约市金融区和华盛顿特区的五角大楼。这是自俄克拉荷马城以来迄今为止最严重的恐怖主义事件。许多事情发生了变化,但一些最重要的教训仍然没有被很好地吸取。

自2003年初以来,一种流感病毒株(H5N1)一直在世界各地传播。可以称之为禽流感(avian flu),也可以称之为猪流感(实际上是另一种毒株,H1N1,对人类更具毒性),但在2009年夏末,它仍然与我们同在,根据世界卫生组织的数据,我们正式处于大流行之中。也许现在是时候回顾俄克拉荷马城和9月11日的教训了,因为一场全面的流感爆发可能比俄克拉荷马或9月11日更能说明我们的系统到底有多么准备充分。

在默拉大楼爆炸事件发生后,进行了一项漫长的调查。在此期间,许多公司倒闭了。在双子塔倒塌后,进行了一项漫长的调查,许多公司也倒闭了。如果发生大流行,可以肯定地说,许多企业将会倒闭。为什么?不是因为生命的损失,而是因为在这些公司工作的人们无法到达他们的办公场所和IT基础设施,去进行他们受雇从事的日常业务,从注册会计师到履行中心,无所不包。1995年造成的破坏封闭了俄克拉荷马城的几个街区,许多公司,主要是小型公司,在此期间失去了进入其办公场所的权限,因为它是一个犯罪现场。同样,纽约市中心的大部分地区也被封锁,出于安全原因,也因为它是一个犯罪现场。一场大流行性流感可能会产生类似的后果,而无需任何警戒线。

作为一名IT架构师,我的工作是构建一个强大而冗余的系统。但是,像大多数人一样,我的假设是基于人们能够前往灾难恢复站点将磁带带到XYZ恢复公司确保我的灾难站点距离我的主要站点x英里。这些是一些教训,金融业吸取了这些教训,并在2001年9月11日之后的几天里非常成功地执行了这些教训,但在我看到的每一张照片和描述中,简易桌子上都铺满了机器和电线,显然是由IT专业人员临时搭建起来的——在许多情况下,他们为了完成这项工作已经工作了很长时间。这种规模的灾难恢复奏效了。但是,当灾难不是系统的损失,而是访问系统的权限和运行系统的人力损失时,会发生什么呢?

如果发生大流行,专家们做出了以下预测。首先,缺勤率可能高达40%。对于一个10人的IT团队来说,这意味着有4个人生病,要么自己生病,要么照顾生病的人。其次,根据严重程度,可能会实行强制隔离。标准是六英尺。想想你的办公桌现在离你的同事有多远。想想你是如何上班的,如果你不能坐在离别人六英尺以内的地方,你将如何上班。这给公共交通问题带来了一个全新的视角。最后,根据贵公司的管理方式,可能会实施轮班制度,一半员工在家,另一半员工在办公室。这将对您的IT服务和管理IT基础设施的能力产生什么样的影响?您是否为即将涌入部门的远程访问请求以及满足这些请求的问题做好了准备?

正如我多次说过的那样,我们这些在IT行业工作的人就是赢不了。当一切顺利运行时,那些算计成本的人会想知道为什么要付钱给我们,而当事情在你周围崩溃时,那些算计成本的人会想知道为什么要付钱给我们。在经济紧张时期,IT几乎总是第一个遭受削减的部门。通常,这些削减发生在堆栈的顶部和底部,让中间的人承担重担,而且往往没有得到关于各种后门、陷阱门和永远流行的那个盒子是做什么用的?的适当简报。在20世纪90年代末和21世纪初,许多公司为了削减成本,抛售了房地产并转向远程访问。在过去的五年左右,这些远程办公趋势已经逆转,因为管理层和员工都希望被视为有价值的(从而保持受雇状态),而且通信线路已被削减为无用支出,而没有考虑到灾难准备。作为IT人员,我们受制于预算。我们大多数人为更关心季度股价以及如何在下一个季度提高股价的公司工作,而很少进行长期战略规划。但情况不必如此。

行使灾难恢复计划是我们的责任。因此,我们有机会将新的策略应用于灾难恢复场景。建议下一次灾难恢复测试包括裁减40%的员工。掷骰子,随机生成姓名,无论什么对你有效,并告诉他们不要来上班。你能让系统重新上线吗?如果你无法将磁带送到灾难恢复站点会发生什么?如果你的远程访问系统无法工作会发生什么?这些只是我们应该思考和准备的一些事情。

作为IT专业人员,我们往往会目光短浅地关注硬件和软件,在许多情况下,我们深入细节,以至于看不到所有部件是如何组合在一起的,或者还需要哪些其他部件,或者正如一位前任老板曾经提醒我的那样,失之毫厘,谬以千里……。因此,当我们坐在飓风季的中间,龙卷风在不寻常的地方爆发并变得更加猛烈时,请记住冬天即将来临,还有其他问题需要关注,我们应该在我们的灾难计划中考虑全灾害方法。有时这意味着设备不会发生任何事情。

加载Disqus评论