系统管理员的任务是对员工/用户的计算设备进行日常的管理和维护,无论它们是直接连接到局域网的独立计算机、远程办公人员的移动设备还是通过公共无线网络或特别可疑的热点连接到广域网的大批平板电脑和智能手机。
新年伊始是确保所有系统井然有序的好时机。下面是确保你的系统为2020年做好准备需要做的10项任务。
1.验证灾难恢复计划有效
灾难恢复计划有效,是不是?这个观念常被人提及,但真正的考验是灾难响应。如果灾难恢复计划不管用,重大事件发生之前仍有时间加以纠正。如果没有实施有效的灾难恢复计划,一切无从谈起。
2.进行操作系统升级
鉴于有大量应用软件可供使用,这是要执行的最简单的任务之一。移动设备或通过不太理想的连接进行通信的设备需要多花一点精力才能成功完成升级。新的一年为你的用户提供新系统会使他们的劲头大一点。
3.为设备安排维修,订购更换部件
安排维修时间或者为出故障的部件或很可能出故障的部件订购替换部件将为你节省时间。
一些服务合同规定了供应商上门评估设备并确定是否存在任何问题——这有点像认证机修工对发动机进行检查。如果发现问题,供应商常可以在IT人员很少参与的情况下帮助迅速有效地维修这些设备,使IT人员腾出时间专注于其他任务。
4.检查服务器的健康状况和性能
类似上面第三点但更重要的是,对提供企业使用的服务的服务器执行健康状况检查。要检查的主要是与潜在硬件故障、服务丢失和资源利用率有关的警报。后者尤其容易出现在根据物理服务器来配置资源的虚拟化环境,从而导致闲置资源常常配置过度。
与这种情况相反的是,服务器缺少资源,因而无法稳定运行。资源太多或太少只有一个结果:一些服务器未正确配置,因而未处于最佳状态下运行。
5.进行预防性维护
有些任务你可能太忙顾不上,或者觉得不需要你亲自操心,预防性维护就是这样的任务。比如,用一罐压缩空气清洁计算机以防止灰尘堆积,使用专门的清洁剂对键盘鼠标进行除尘,以提高功能和使用寿命。不管怎样,各个级别的许多人可以执行许多预防性维护任务,这种维护可以延长设备的使用寿命。
6.更新许可协议
这似乎是另一项乏味的任务,却是是与IT相关的重要任务。如果不加控制,许可证管理会严重影响公司的底线。开发人员喜欢使用其软件带来经济利益,任何违规行为都可能导致巨额罚款。
进行尽职调查以评估所有设备上的当前和预计使用情况,包括基于CPU数量为虚拟化实例制定有时棘手的许可结构,这只是表面上的工作。别忘了操作系统升级和设备的支持协议,包括固件更新等方面。更新后的许可记录清单还可以更好地管理未来的IT资金,如果通过虚拟化整合服务器和客户端桌面可以降低许可费、节省资金(省下来的钱可重新用于其他支出),更是如此。
7.确保监控工具已更新
占用空间越大,企业组织使用某种监控工具的可能性越大。无论是基于许可证还是开源,用于监控和管理用户的服务器和工作站都应定期更新,以求最大程度的保护和稳定性。没有哪个时段比现在更适合执行这些任务了,以验证所有管理系统已经过优化、有效运行。
8.清点硬件、报告系统健康状况
一份简洁的硬件清单可帮助IT人员了解系统所在的位置,而系统健康状况检查有助于确定这些节点的状态,它们是缺少任何更新还是需要调优或更换硬件。
9.分析日志输出结果以找出隐藏问题
所有设备都会生成日志,IT人员不可能逐条阅读每台设备上生成的每条日志,否则什么工作都干不了。幸好我们有syslog服务器,其任务就是将所有这些日志关联到一个集中的位置,对逐条日志进行整理组织,确定哪些日志很重要,因此应立即采取行动,哪些日志可以晚点响应。
从日志文件收集的信息还可以让IT人员知道在新的一年如何着手工作。如果结合其他类型的报告,就能更全面地了解网络,进而了解未来要侧重的管理任务和要开展的项目。
10.执行补丁和变更管理
这是不二的选择。补丁管理、更新、热修复都必须定期执行,并在受控制的范围内进行。这在大公司可能很棘手,因为先要在一段确定的时间内测试补丁,然后才能部署到整个生产环境中。这会给最终用户造成服务停运。
始终进行彻底的测试,确认已在所有设备上打上补丁。还应该附上详细的变更管理文档,以识别和跟踪回归测试时出现的变更,或者以便在后续修补程序管理期间注明未来的问题。
原文标题:Systems admins checklist: 10 tasks to perform every year,作者:Jesus Vigo