DELL服务器硬件报错及对应的解决方法(R720)

2019-07-14 02:36发布

class="markdown_views prism-tomorrow-night">

前言



由于我们的服务器的型号较多,前面板的报错的信息的格式也是多样的,下面是从网上总结DELLR720的报错及对应的解决方法。

正文


代称含义


特定的系统组件 name
组件号 number
位置 bay

AMP0302

> The system board <name> current is greater than the upper warning threshold. > 系统板 <name> 电流超出适宜范围 操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。

AMP0303

System board <name> current is outside of range. 系统板 <name> 电流超出适宜范围 操作
审查系统电源策略。
检查系统日志确认电源相关故障。
审查系统配置更改。

ASR0000

The watchdog timer expired. 操作系统或应用程序在超时时段内通信失败 操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。

ASR0001

The watchdog timer reset the system. 操作系统或应用程序在超时时段内通信失败,系统被重设 操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。

ASR0002

The watchdog timer powered off the system. 操作系统或应用程序在超时时段内通信失败,系统被关闭 操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。

ASR0003

The watchdog timer power cycled the system. 操作系统或应用程序在超时时段内通信失败,系统在关闭后再次开启。 操作
检查操作系统、应用程序、硬件和系统事件日志以排查异常事件。

BAT0002

The system board battery has failed. Check battery. 系统板电池失效。 操作
更换电池。

BAT0017

The <name> battery has failed. Check battery. 电池 <name> 可能出现缺失、故障因为温度问题导致无法充电。 操作
检查系统风扇。
如非风扇问题,更换电池。

CPU0000

CPU <number> has an internal error (IERR). CPU <number> 出现内部错误.也许异常出现在处理器之外 操作
审查系统事件日志和操作系统日志。

CPU0001

CPU <number> has a thermal trip. Check CPU heat sink. CPU <number> 出现热断路,检查 CPU 散热器 操作
检查风扇故障日志。
如果未检测到风扇故障,请检查进气孔温度(若适用)并重新安装处理器散热片

CPU0005

CPU <number> configuration is unsupported. Check CPU or BIOS revision. CPU <number> 配置受支持,检查 CPU 或 BIOS 修订版本。系统无法引导,或正在降级运行。 操作
检查所支持的处理器类型的技术规格。

CPU0010

CPU <number> is throttled. 因为温度或电源情况导致 CPU<number>被节流。 操作
查阅系统日志排查电源或温度异常。

CPU0023

CPU <number> is absent. Check CPU. CPU <number> 缺失,检查 CPU。 操作
验证处理器安装。
如果存在,则重新安装处理器。

CPU0204

CPU voltage is outside of range. Re-seat CPU.
CPU 电压超出范围,重新安装 CPU。电压超出容许范围可能损坏电气组件,或导致系统关闭。 操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。

CPU0700

CPU <number> initialization error detected. Power cycle system. 检测到 CPU <number> 初始化错误,系统电源关闭然后打开。 操作
关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。

CPU0701

CPU protocol error detected. Power cycle system.
检测到 CPU 协议错误,系统电源关闭然后打开 操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。

CPU0702

CPU bus parity error detected. Power cycle system. 检测到 CPU 总线奇偶校验错误,系统电源关闭然后打开。 操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。

CPU0703

CPU bus initialization error detected. Power cycle system. 检测到 CPU 总线初始化错误,系统电源关闭然后打开。 操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。

CPU0704

CPU <number> machine check error detected. Power cycle system. 检测到 CPU <number> 机器检查错误,系统电源关闭然后打开。 操作
检查系统和操作系统日志以排查异常。
如果未发现异常,则关闭系统并断开输入电源一分钟。
确保处理器安装正确。
重新提供输入电源并打开系统。

FAN0000

Fan <number> RPM is less than the lower warning threshold. 风扇<number>运行速度超出范围。 操作
卸下并重新安装风扇。

FAN0001

Fan <number> RPM is outside of range. Check fan. 风扇 <number> 运行速度超出范围。 操作
卸下并重新安装风扇。

FAN1201

Fan redundancy lost. Check fans. 风扇发生故障。 操作
卸下并重新安装故障的风扇或安装其它风扇。

HWC1001

The <name> is absent. Check hardware. 硬件<name> 缺失,检查硬件。可能导致系统功能降级。 操作
重新安装或重新连接硬件。

HWC2003

Storage <name> cable or interconnect failure. Check connection. 存储设备 <name> 电缆或互联故障,请检查连接。可能导致系统功能降级。 操作
检查电缆是否存在,重新安装或重新连接。

HWC2005

System board <name> cable connection failure. Check connection. 系统板 <name> 电缆连接故障,请检查连接。可能导致系统功能降级。 操作
检查电缆是否存在,然后重新安装或重新连接。

MEM0000

Persistent correctable memory errors detected on a memory device at location(s) . 在内存设备的位置 处检测到永久可纠正的内存错误。 操作
重新安装内存。

MEM0001

Multi-bit memory error on . Re-seat memory. 处的多位内存错误,重新安装内存。可能导致系统功能降级,操作系统和/或应用程序可能会发生故障。 操作
重新安装内存。

MEM0007

Unsupported memory configuration. Check memory . 内存可能安装不正确,配置错误,或者发生故障,内存大小减少。 操作
检查内存配置。重新安装内存。

MEM0701

Correctable memory error rate exceeded for . 内存可能无法操作。 操作
重新安装内存。

MEM0702

Correctable memory error rate exceeded for . Re-seat memory. 的可纠正内存错误比率超限,重新安装内存。 操作
重新安装内存。

MEM1205

Memory mirror lost on <location>. Power cycle system. 内存可能安装不正确,配置错误,或者发生故障。 操作
检查内存配置。重新安装内存。

MEM1208

Memory spare lost on <location>. Power cycle system.( 内存备份不再可用。 操作
重新安装内存。

MEM8000

SBE log disabled on <location>. Re-seat memory. 上 SBE 日志已禁用,重新安装内存。 操作
检查系统日志排查内存异常。
重新安装位于 处的内存。

PCI1302

A bus time-out was detected on a component at bus <bus> device function . 总线 <bus> 设备 功能 的组件上检测到总线超时。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PCI1304

I/O channel check error detected. Power cycle system. 检测到 I/O 通道检查错误,系统电源关闭然后打开。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PCI1308

PCI parity error on bus <bus> device <device> function <func>. Power cycle system. 总线 <bus> 设备 <device> 功能 <func> 上的 PCI 奇偶校验错误,关闭并打开系统电源。可能导致系统功能降级,PCI 设备可能无法运行,或系统无法运行。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PCI1320

Bus fatal error on bus <bus> device <device> function <func>. Power cycle system. 总线 <bus> 设备 <device> 功能 <func> 上的总线严重错误,关闭然后打开系统电源。可能导致系统功能降级,或系统可能无法运行。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PCI1342

A bus time-out was detected on a component at slot <number>. 插槽 <number> 的组件上检测到总线超时。可能导致系统功能降级,或系统可能无法运行。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PCI1348

PCI parity error on slot <number>. Re-seat PCI card. 插槽 <number> 上的 PCI 奇偶校验错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PCI1360

Bus fatal error on slot <number>. Re-seat PCI card. 插槽 <number> 的严重总线错误,重新安装 PCI 卡。可能导致系统功能降级,或系统可能无法运行。 操作
关闭并打开输入电源,更新组件驱动程序。
如果设备可卸下,则重新安装设备。

PDR0001

Fault detected on drive <number>. Check drive. 控制器在磁盘上检测到故障,并已使磁盘脱机。 操作
卸下然后重新安装有故障的磁盘。
Drive <number> removed from disk drive bay <bay>. Check drive. 控制器检测到驱动器已卸下。 操作
验证驱动器的安装。
重新安装有故障的驱动器。

PST0128

No memory is detected. Inspect memory devices. 系统 BIOS 无法检测到系统中的内存。 操作
重新安装内存。

PST0129

Memory is detected, but is not configurable. Check memory devices. 系统 BIOS 检测到内存,但无法基于系统运行对其进行配置。 操作
将系统内存安装与支持的系统内存配置进行比较。

PSU0001

PSU <number> failed. Check PSU. PSU <number> 故障,检查 PSU。 操作
卸下并重新安装电源设备。

PSU0002

Predictive failure on PSU <number>. Check PSU. PSU <number> 上的预测故障,检查 PSU。 操作
卸下电源设备并重新安装。

PSU0003

Power input for PSU <number> is lost. Check PSU cables. PSU <number>电源设备安装正确,但输入源未连接或未起作用。 操作
验证输入源连接到设备。
验证输入源符合电源设备的操作要求。

PSU0006

Power supply is incorrectly configured. Check PSU.
电源设备 未正确配置,检查 PSU。电源设备的输入类型和额定功率应当相同。 操作
安装匹配的电源设备。

PSU0016

PSU <number> is absent. Check PSU. PSU <number> 电源设备已卸下或出现故障。 操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。

PSU0031

Cannot communicate with PSU <number>. Re-seat PSU. 电源设备可以运行,但是电源设备的监控已降级,系统性能将降级。 操作
卸下并重新安装电源设备。

PSU0032

The temperature for power supply <number> is in a warning range. 电源设备 <number> 的温度在警告范围内。 操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。

PSU0033

PSU temperature outside of range. Check PSU.
PSU 温度超出范围,请检查 PSU。
操作
检查系统运行环境,包括通风和进气孔温度。
查看温度和热组件故障的日志。

PSU0034

An under voltage fault detected on PSU <number>. Check power source. 在 PSU <number> 上检测到电压过低故障,请检查电源。 操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。

PSU0035

Over voltage fault on PSU <number>. Check PSU. 在 PSU <number> 上发生电压高过故障,请检查 PSU。 操作
检查输入电源或重新安装电源设备。

PSU0036

An over current fault detected on PSU <number>. Check PSU. 在 PSU <number> 上检测到电流过高故障,请检查 PSU。 操作
卸下并重新安装电源设备。
检查系统中的线缆和子系统组件以排查损坏。

PSU0037

Fan failure detected on PSU <number>. Check PSU. 在 PSU <number> 上检测到风扇故障,请检查 PSU。 操作
检查风扇是否阻塞。

PSU0076

PSU wattage mismatch; PSU <number> = <value >watts PSU 功率不匹配;PSU <number> = <value > 瓦特 ,电源设备的输入类型和额定功率应当相同。 操作
安装匹配的电源设备。

PSU1201

Power supply redundancy is lost. 电源设备冗余缺失。 操作
检查输入电源。
重新安装电源设备。

PSU1204

PSU redundancy degraded. Check PSU cables. PSU 冗余降级,检查 PSU 电缆。电源设备异常、电源设备资源变化,或系统电源资源变化。 操作
检查事件日志排查电源设备故障。
查看系统配置和功耗。

PWR1004

The system performance degraded because power capacity has changed. 因为电源容量变化系统性能已降级。 操作
检查事件日志排查电源设备故障。
查看系统配置和功耗,并据此升级或安装电源设备。

PWR1005

The system performance degraded because the user-defined power capacity has changed. 用户定义的电源设置影响系统运行。 操作
如果是意外导致,查看系统配置变化和电源策略。

PWR1006

System power demand exceeds capacity. System halted.
系统电源需求超出容量,系统已停止。
操作
查看系统配置,升级电源设备或降低系统功耗。

RFM1008

Removable Flash Media <name> failed. Check SD Card. 可移动的闪存介质 <name> 出现故障,检查 SD 卡。SD 卡读取或写入过程中报告了错误。 操作
重置闪存介质。

RFM1014

Removable Flash Media <name> is write protected. Check SD Card. 可移动的闪存介质 <name> 为写保护状态,检查 SD 卡。该卡被 SD 卡上的物理锁进行了写保护,写保护状态的卡无法使用。 操作
如果是意外导致,卸下介质并禁用写保护。

RFM1201

Internal Dual SD Module redundancy is lost. Check SD Card. 其中一块或两块 SD 卡工作不正常。

RFM2001

Internal Dual SD Module is absent. Check SD Card. 未检测到 SD 卡模块或该卡未安装。 操作
如果无意如此,则重新安装 SD 模块。

RFM2002

Internal Dual SD Module is offline. SD 卡模块已安装,但可能安装不正确,或配置不正确。 操作
重新安装 SD 模块。

RFM2004

Internal Dual SD Module failed. Check SD Card. SD 卡模块已安装,但配置不正确,或无法初始化。 操作
重新安装 SD 模块,然后卸下并重新安装 SD 卡。

RFM2006

Internal Dual SD Module is write protected. 此模块为写保护,更改可能无法写入到介质。 操作
如果是意外导致,卸下介质并禁用写保护。

SEC0031

Intrusion detected. Check chassis cover. 检测到侵入,检查机箱盖。 操作
关闭机箱,检查系统日志。

SEC0033

Intrusion detected. Check chassis cover. 电源关闭状态下机箱打开。 操作
关闭机箱并验证硬件资源。
检查系统日志。

SEL0006

All event logging is disabled. 当用户禁用所有事件日志。 操作
若是意外导致,则重新启用日志。

SEL0008

Log is full. 日志已满。日志已满时,其他事件将不会写入到日志。早期的事件可能被覆盖并丢失。如果用户禁用了事件记录,也可能显示此消息。 操作
备份并清除日志。

SEL0012

Could not create or initialize the system event log. 无法创建或初始化系统事件日志。系统事件日志初始化失败,将不会捕获平台状态和故障事件,某些管理软件不会报告平台异常。 操作
重新引导管理控制器或 iDRAC。
关闭然后打开输入电源。

SEL1204

Unknown system hardware failure. 未知系统硬件故障。 操作
将系统重新配置为所支持的最低配置。

TMP0118

System inlet temperature is outside of range. 环境气温过低. 操作
检查系统运行环境。

TMP0119

System inlet temperature is outside of range. 环境气温过低。 操作
检查系统运行环境。

TMP0120

System inlet temperature is outside of range. 环境气温过高,或者可能一个或多个风扇发生故障。 操作
检查系统运行环境并查看事件日志排查风扇故障。

TMP0121

System inlet temperature is outside of range. Check Fans. 环境气温过高,或者可能一个或多个风扇发生故障。 操作
检查系统运行环境并查看事件日志排查风扇故障。

VLT0204

System board voltage is outside of range. 系统硬件检测到电压过高或过低的情况。如果连续出现多个电压异常,系统可能切换到故障安全模式。 操作
查看系统日志了解电源设备异常。
将系统重新配置为最低配置,检查并重新安装系统电缆。