在这份灾难恢复报告中指出了一些导致大灾难的故障点,并说明如何做出正确的决定才能使数据中心正常运行。
从告警开始到灾难结束,数据中心火灾几乎摧毁了整个运营中心。最终,不良设计与预算选择是一切的元凶。
边缘计算的时代已经来临。超越数据中心的分散处理和存储正在成为新的规范但迎风踏浪之前需要认清其面临的障碍,比如冷却挑战。
我们正在建造一个3,700平方英尺的服务器区域,将容纳175个服务器机柜以及行冷却。这是个新建项目。如何估算每个机柜的功耗与重量呢?
在数据中心里,建议的湿度水平为45%至50%。几十年来的传统结论,为了避免静电的影响,提高数据中心的湿度水平是一个必要手段,但现在却不是这么样。
没人可以做到100%准确,但也有一些指南可用于分析基础设施能力问题,以及未来可能的发展趋势,可以对数据中心能力有相对可靠的估计。
在电力系统一直保持稳定状态的情况下,网络设备在进行固件升级之后发生故障,管理员显然将故障定位在防火墙或者VPN等网络设备。
使用阀控式铅酸蓄电池的数据中心可以把密封的电池冷装入电池冷却柜,冷却到22至25摄氏度(68-77华氏度),而不需要将整个数据中心冷却到同一温度,但这种办法并不经济。
你在管理UPS电池的预期寿命么,还是因为设备都在保修期,就不必把它们的寿命放在心上?
好的DCIM软件应该是款有价值的工具,帮助管理运营,并对即将发生的问题进行告警,几乎无需人力投资。它还能做更多事情,但首先你得HOLD住它。