服务热线: 0755-26821608

机房的管理与维护经验谈

日期: 2018-12-03
浏览次数: 14

机房的管理与维护经验谈


       机房管理本身就是技术活,比较费脑筋,都是精密仪器设备设施,加上一些制度,或者领导的严格要求,一有点风吹草动,作为我们这些现场运维人员可就忙的焦头烂额,不亦乐乎,加班加点,问题多,头绪多。经验要多,办法要多,思路也要打开了,机房管理说简单也简单,不出问题就闲着耍,一旦不稳定,故障频繁那可就来灾了。下面是机房管理,我认为比较头疼,时刻关注的问题,ups电池换了很多次了,依然充放电时间不长,紧密空调找了很多的空调维修队,还是制冷效果差。

       每天就这些事,服务器运行不正常了,找原因吧,联系厂家,再联系使用人问题所在,然后调试程序,做好备份,记录。样样都是重点,马虎不得,粗心大意更是要不得。

机房的管理与维护经验谈

一、机房概述

机房又称为网络数据中心、数据处理中心和数据交换中心。在IT业,机房普遍指网络运营商、政府或者企业等,我主要的工作是企业机房所有设备维护,存放服务器,核心网络设备,为企业、用户以及员工提供信息服务的地方,机房里面通常放置各种服务器和小型机,例如IBM小型机,交换机,负载均衡等等,机房的温度和湿度以及防静电措施都有严格的要求,非专业项目人员一般不能进入,机房里的服务器运行着很多核心业务,例如企业的ERP,OA,MES系统、通话业务等。由此可见机房对企业信息化建设的重要性。

二、信息化机房对企业的重要性

计算机机房是企业信息数据汇集、转发的重要场所。企业的协同办公系统、财务系统、营销系统、互联网链接等重要系统的服务器交换设备都集中在机房,所以企业对计算机机房的稳定性、可靠性、安全性要求较高。一但电力系统、网络系统、服务器,空调系统等出了故障,造成业务终端不能正常访问,造成的经济损失是不可估计的,

三、 维护目的

保障机房设备正常运行,对机房环境支撑系统、电力和UPS系统、监控设备,空调设施,消防、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护人员的产品维修和技术支持,并快速解决故障。需要有一个具有丰富机房管理经验的人,日积月累的发现,分析,解决问题艰巨过程。

机房的管理与维护经验谈

四、 维护内容

1、机房主机设备维护管理:计算机服务器(包括PC服务器及存储服务器);网络设备(交换路由设备等)。

2、机房监控设备维护管理:供配电监测系统、温湿度环境检测系统、门禁设备系统、保安监控设备。

3、机房空调与配电设备维护管理:空调设备、新风设备、UPS电池、主配电箱。

4、机房消防设备维护管理:烟感热感探测器、手动报警按钮和报警控制器、灭火器的控制装置。

5、机房供水水路、电路及照明维护管理:水电路管线及接口的检查维护。

6、机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、防火地板、墙面、吊顶、门窗及相关配套的维护管理。

三、具体维护方案

1、机房主要设备维护及安全:

服务器维护及安全:

每天观察服务器的各种指示灯状态,是否有红灯报警,是否有异常现象,声响等,发现登录服务器迟缓,反应迟钝,ping,远程桌面是否流畅,做好服务器的备份。

网络设备安全

交换机的安全

保存好交换机的设置备份,留有备用交换机,交换机属于易耗品,留有备品备件便于及时更换。

②路由器的安全:

联系官方做好服务器设置,尤其是安全设置,密码口令,安全策略等。同样做好配置设置的备份,万一故障必须有替代方案。

2、机房除尘及环境要求:定期对设备进行除尘处理,清理,擦拭,调整安保摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备内部。同时检查机房通风、散热、净尘、供电等设施。机房室内温度应控制在+15℃~+25℃,相对湿度应控制在20%~50%。

3、机房空调及新风维护:检查空调运行是否正常,换风设备运转是否正常。从视镜观察制冷剂液面,看是否缺少制冷剂。检查空调压缩机高、低压保护开关、干燥过滤器及其他附件。每天检查空调温湿度指示,身体力行感受检查机房温湿度情况。

机房的管理与维护经验谈

4、UPS及电池维护:根据实际情况进行电池定期进行核对性容量测试;进行电池组充放电维护及调整充电电流,确保电池组正常工作;检查记录输出波形、谐波含量、零地电压;查清各参数是否配置正确;定期进行UPS功能测试,如UPS同市电的切换试验。每年进行两次的完整的放电,激活UPS的电池活性。

5、消防设备维护:检查火警探测器、手动报警按钮、火灾警报装置外观及试验报警功能;检查火灾警报控制器的自检、消音、复位功能及主备用电源切换功能。

6、电路及照明电路维护:镇流器、灯管及时更换,开关更换;线头氧化处理,标签巡查更换;供电线路绝缘检查,防止意外短路。

7、机房基础维护:静电地板清洗清洁,地面除尘;缝隙调整,损坏更换;接地电阻测试;主接地点除锈、街头紧固;防雷器检查;接地线触点防氧化加固。

8、机房运维管理体系:完善机房运维规范,优化机房运维管理体系。维护人员24小时及时响应。

机房维护计划

1.周维护主要内容:

l 清洁机架内外、设备面板和监视器、显示器屏幕;

l 检查个切换开关功能键、监测报警系统的功能及各设备指示状态;

l 检查机房供配电,UPS系统;

l 检查机房空调和照明设备。

2.月维护主要内容:

l 周维护所有内容;

l 整理各机架设备连接线;

l 检查服务器配置情况;

l 检查交换机各个端口工作状态;

l 检查服务器运行状态并记录;

l 检查各光发射、接收设备的工作状态。

l

3.季维护主要内容:

l 周、月维护所有内容;

l 清洁机房空调的过滤网,检查空调运行情况,必要时补充制冷剂;

l 按操作规程对蓄电池进行完全的充放电维护;

l 对企业连接机房的外围线路进行全面性能检查和维护。

做好计算机机房的日常管理与维护

机房管理与维护是一项系统工程,其涉及面广、事务杂、工作量大,主要包括机房环境维护、机房安全管理、机房设备管理等工作。

  (一)明确分工,建立责任追究机制。中心机房是一个复杂的系统集成环境,主要由配电系统、精密空调系统、消防系统、防雷系统、门禁系统、监控与报警系统及大量的服务器、网络设备等组成。中心机房的专业性、复杂性决定了信息中心必须明确分工,保证每一个子系统都由专人管理,这样才能有效避免管理过程中出现互相扯皮、职责不清的现象。同时,在职责明确的前提下,要建立科学合理的责任追究机制,防止出现由于工作态度、工作作风等各种人为因素导致的机房故障。

  (二)责任意思,完善自动报警体系。一般情况下,中心机房都配有可靠的机房环境监控与预警系统,以确保设备的安全运行。但该系统监控范围有限,只能实现对配电系统、空调系统、机房温湿度等外部环境的监控。因此,信息中心应有责任心,有积极负责的态度,完善自动报警体系,扩大监控范围,实现全天候监控。

(三)搞好机房环境管理。机房的环境管理主要包括温湿度控制、防尘、通风等方面。

要调节好温湿度。交换机、服务器等设备对机房的温度有着较高的要求。温度偏高易使机器散热不畅,导致晶体管的工作参数出现误差,影响电路的稳定性和可靠性,严重时还会造成元器件的损坏。湿度对设备的影响也很大。空气潮湿,易引起设备的金属部件生锈,导致电路板、插接件和布线的绝缘性能降低,严重时还可造成电路短路;空气太干燥又容易产生静电,威胁设备的安全。为了使机房的温度和湿度符合标准,机房安装精密空调,机房应根据根据设备情况设定适合恒定的温度与湿度。

  要做好防尘和通风工作,平时工作人员进入机房时应自觉清除身上的灰尘,并更换机房专用工作服、工作鞋。工作服、工作鞋需定期清洗,以保持机房卫生。为确保机房的通风和防尘,应安装带过滤器的风机,经常查看过滤网吸尘情况,并定期做好清洁和更换工作。

  (四)加强机房安全管理。

  做好配电安全。目前,机房一般采用双路供电方式来保证用电。为了保障机房用电安全,其他与机房无关的设备应禁止接入机房内电源。同时,定期对机房电源进行安全检查,以防隐患。

  保障设备安全。机房要做好出入登记、施工管理、参观管理等工作。非工作人员未经审批严禁进入机房,维护单位人员由于工作需要进入机房的,要戴好鞋套等,并在机房出入登记簿上填写进入机房时间、进入事由。机房内的重要设备应安装防雷装置,以防在夏季雷雨季节被雷电击中损坏。此外,机房消防设施应配有自动预警、报警装置。

保障系统与数据的安全。系统和数据安全主要包括系统安全、病毒防范、数据保密三方面。为保障系统与数据安全,要对网络设备及服务器的各种账号密码实行动态密码管理,并定期更新操作系统;使用防火墙、入侵检测软件、上网行为管理器等全方位地保障数据安全;利用防病毒软件防范病毒,保证设备的安全运行。同时,建立高效的数据备份和故障快速恢复系统,不定期地对各系统中的数据进行备份,确保系统发生故障时能够快速恢复。

  (五)搞好机房软、硬件的日常维护。机房内的各项应用系统、网络设备、服务器等因为使用频率高,故障率也比较高。为了保证机房正常运作,提高设备的正常工作率,保障系统正常运行,做好设备的日常维护工作十分必要。

要建立机房设备管理台账。台账应包括设备名称、品牌、型号、配置、购置时间、保修期、用途、维修记录、零配件更换记录等内容。

要建立硬件设备的备份库,以保证损坏的设备得到及时更换。

要建立应用系统安装配置文档,完整保存服务器及网络设备的驱动程序、保修卡及重要随机文件,以保证在服务器损坏的情况下能够快速恢复系统的正常运行。

  要建立日常巡检制度,对服务器、数据库、各应用系统实行日常巡检,并做好运行日志,形成完善的软、硬件运行日志台账。

  (六)借助外力,联合厂商定期巡检。可建立厂商定期巡检制度,借助厂商的技术力量,定期对机房精密空调系统、UPS不间断电源电池、消防系统等各类子系统和软、硬件设备运行情况进行全面检查,并编写统一巡检报告。厂商在巡检过程中发现存在的隐患,需提供故障情况诊断报告和改进建议。信息中心管理人员对巡检过程要紧密跟踪,以保证巡检质量。巡检周期可以根据各系统的特点灵活确定,原则上所有设备每年至少巡检维保两次。

机房日常运行维护工作的意义重大,关系整个生产企业的正常运作,同时也可以反映出一个企业的信息化建设水平。要做好机房日常管理与维护,不仅要求机房管理员具有较高的业务技术,还要具有足够的耐心和高度的责任心。


faq / 其他方案


TOP
办公地址:深圳市南山区工业大道西工业八路南路悠然居二楼B区-73号室
联系电话:  13728636902  0755-26821608
投诉:0755-26821608
邮编:330520
版权所有 © 2018-2019 深圳市一路信息技术服务有限公司
犀牛云提供企业云服务
分享到:
服务热线 0755-26821608
友情链接: / Link
X
1

QQ设置

3

SKYPE 设置

4

阿里旺旺设置

5

电话号码管理

  • 4006-971-972
6

二维码管理

展开