周末阅读:服务器机房的恐怖故事
发表于 2019年3月30日
从别人的错误中学习总是比从自己的错误中学习更好。这个周末,我们邀请了 Kyle Rankin 和 Bill Childers 来讲述他们作为系统管理员多年的 故事 。这是一个双赢:你可以从他们的经验中学习,他们可以互相发表刻薄的评论。
永远都是DNS的错!作者:Kyle Rankin 和 Bill Childers
我当时非常痛苦。 我们刚刚完成了一个通宵的生产存储区域网络交换机迁移,同时我正在咳嗽着与行走性肺炎作斗争。 虽然我在家完成了整个通宵工作的一部分,但我还是筋疲力尽。 所以当我的寻呼机在早上 9 点响起时,只给了我四个小时的睡眠,我正危险地接近僵尸区域...
区域划分错误作者:Kyle Rankin 和 Bill Childers
有时,事件和设备会联合起来对抗你和你的团队,从而导致问题。 然而,偶尔,也可能是缺乏理解或远见而导致事与愿违。 不幸的是,这是一个关于我们未能发现所有可能出错的事情的故事。
伦敦街头的恐慌作者:Kyle Rankin 和 Bill Childers
我现在处于故障排除的下一个阶段:祈祷。 大约在这个时候,我有了重大突破...
开箱日作者:Kyle Rankin 和 Bill Childers
尽管我喜欢使用 Linux 和配置软件,但作为系统管理员,我一直喜欢的一个主要部分是使用实际的硬件。 使用有形的、物理的服务器有一种感觉,这为我的工作增加了一个额外的维度,并使其进一步脱离了现实,否则它可能是一项完全抽象的工作。 最重要的是,当你收到一大批服务器,并且你将公司的服务器视为你的服务器时,当你打开服务器包装盒时,会有一种类似于在家打开圣诞礼物的期待和兴奋。 这个故事恰好是在圣诞节期间开始的...