网站首页站长博客下载中心域名交易站长论坛域名主机免费电邮免费域名中文排行排名查询站长书库书籍教程下载
设为首页
加入收藏
总编信箱
投稿或申请专栏请先 [登 陆]
学院首页 网络编程 网页设计 图形图象 数 据 库 服 务 器 网络媒体 网络安全 个人专栏 站长CLUB 业界新闻 信息公告
 当前位置:首页 >> 服 务 器 >> 其他相关 >> 正文
公告通知
返回上级列表
资料搜索
相关文章
数据库系统防黑客入侵技术(一)
linux中经典问题(四)
linux中经典问题(三)
linux中经典问题(二)
linux中经典问题(一)
Windows下的Apache+PHP+MySql+虚
由Windows 2000升级至2003的10大
架设维护Windows Server 2003网页
Win2000中优化Web服务器性能 
WIN2000服务器安全配置 
服务器硬件故障处理几例
[ 来源:CSDN | 作者:无从考证 | 时间:2006-4-1 6:16:28 | 浏览:人次 ]
收藏到新浪ViVi 收藏到365KEY 收藏到我摘  字号选择〖    〗/ 双击滚屏 单击停止  

硬件故障是指服务器硬件出现异常而导致的各类错误。由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。下面以一台LH6000为例说明。

  有一台HP LH6000,配有256M内存,使用一个PIII XEON 700带2M高速缓存的处理器。开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。因为CPU板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错误的,并且在系统日志中会提示致命错误,但报CPU电压错的情况也有5%左右。我们立刻把CPU调换在另一CPU插槽中,开机后依然是刚才的那种故障。所以在初步判断中,可以排除是CPU板块坏。

  这时,取出CPU仔细擦拭金手指,以及CPU板块中与CPU接触的地方后,开机依然无显示。

  相对处理器坏的情况来说处理器电压模块(VRM)出现故障的情况比较大。于是立即在另一台LH 6000中取下一个处理器电压模块,安装在此服务器中。开机后,服务器依然没有任何显示,系统日志上依然提示CPU电压为0伏的信息,系统指示灯三灯依然不停在闪烁。这时的情况就比较明显了。于是立即从另一台LH6000中取下一个CPU安装后,开机正常。

  在服务器的维修中,线索都会显得扑朔迷离,一般来说不可能一次就可以准确地判断出问题的所在。这样就要求相关人员要有信心及耐心。出现错误一般的流程是通过系统日志上的信息来解决,如果没有解决问题再找出其它因素,然后再看日志信息。总之,服务器出错后,必须一步一步解决,没有捷径可言。

  又如:

  有一台HP LH 4开机不显示,发现开机时系统日志没有任何信息,且系统指示灯不亮。初步判断是电源方面出现了错误。经过仔细检查,发现服务器的电源是正常的,因此最大的可能就是服务器的电源管理板出现故障。更换电源管理板后,开机显示正常。但这时,新的问题来了:自检时,用CTRL+M不能检测到硬盘。

  硬盘在别的服务器上是正常的,因此立即清除此服务器的CMOS,但依然不正常。我立刻上网找到此服务器的最新BIOS,升级BIOS后也不能解决问题。又检查硬盘笼子和服务器里的数据线及电源线后依然出错。这时,一般情况会怀疑是服务器的I/O板(输入输出板块)有问题。但就在这个时候,我发现在I/O板上有一个非HP的旧式网卡,立即去除此网卡后服务器就一切正常。

  硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议大家在采购各元件时,都采用同一品牌原装的,并且要采用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能),这样才不会发生莫明其妙的故障。

  我曾遇到过一种情况:用户需要把他的HP LH6000升级到双网卡,我建议他购买原装网卡,但当他看到HP LH6000的网卡是采用的INTEL 82559芯片后,断然决定不使用原装网卡而采用另一品牌也采用INTEL 82559的网卡。过了几天,他打电话给我说,他的新网卡不能使用网络冗余及数据校验,并怀疑服务器有问题。我带了一个HP网卡到用户那里,仔细检查了服务器的环境完全正常后,把HP网卡安装到机器上后一切正常。这个例子更加说明了,要发挥服务器的最大性能及功能,必须使用原品牌原装的配件。非原品牌非原装的配件,不能支持服务器的某些功能,严重的会影响到服务器的正常使用。

  一般来说中、高端的服务器报警系统都比较完善,除了系统日志外,还有指示灯。以HP LH6000来说,指示灯的绿色灯常亮表示服务器正常;绿灯亮而黄色闪烁表示服务器有故障,但不是致命的;如果三灯闪烁(绿、黄、红三灯)就表示服务器有致命故障,服务器停止运行。相比较而言,指示灯只能提示比较笼统的故障,而系统日志就比较完全。在维修中,必须仔细察看这两种报警系统的信息。有一点必须注意的是系统日志是一个存储器,容量有限(LH 6000能存200条信息)。当容量不够时必须清空,否则服务器将报警,一般是服务器指示灯报非致命错误,但却不能再存任何信息。

  要避免硬件故障发生频率,服务器管理人员必须注意服务器的使用环境完全正常。比较重要的服务器必须在恒温、恒湿的环境;电压也要符合,不仅要采用UPS,还必须接地线,必须是左零线、右火线,零地电压在1~3伏。在开、关服务器上必须符合正常的流程。工作人员必须严格执行操作流程。


[发送给好友]  [打印本页]  [关闭窗口]  [返回顶部]   转载请注明来源:http://edu.chinaz.com   
特别声明: 本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
栏目编辑: 设计风 责任编辑: keke
原始作者: 无从考证 录入时间: 2006-4-1 6:16:28
信息来源: CSDN 投稿信箱: Edu#chinaz.com
设为首页 - 加入收藏 - 关于我们 - 广告服务 - 版权申明 - 友情链接 - 联系方式 - 总编信箱 - 会员投稿