数据结构 - NVM子系统硬件错误事件代码(图233) (第221页)
NVME2.0协议解读 1 min read

数据结构 - NVM子系统硬件错误事件代码(图233) (第221页)

Blog Author

NVM子系统硬件错误事件代码(图233)

NVM子系统硬件错误事件提供了有关硬件故障和关键警告条件的信息。以下是不同错误事件的详细说明:

错误事件代码及描述

错误代码 错误类型描述
07h Endurance Group Critical Warning Condition:表示NVM子系统检测到条件,导致Endurance Group Information日志中的Critical Warning字段被设置为‘1’。
08h Unsafe Shutdown:表示在SMART/健康信息日志中的Unsafe Shutdowns字段被递增,指示设备在断电时未安全关闭。
09h Controller Fatal Status:表示控制器的Fatal Status (CSTS.CFS)位被设置为‘1’,意味着控制器处于严重故障状态。
0Ah Media and Data Integrity Status:表示完成队列条目包含的媒体和数据完整性状态码(例如,非86h或87h)。
0Bh Controller Ready Timeout Exceeded:表示控制器未能在规定的时间内准备好处理命令,或者至少一个命名空间未准备好以处理管理员命令。
0Ch to FFh 保留:这些错误代码未定义。

附加硬件错误信息(图234)

某些硬件错误类型可能包含附加信息,以便更详细地描述发生的错误。例如:

  • PCIe错误(例如,可修正的或不可修正的错误)将包括PCIe设备状态寄存器的内容。该寄存器的值用于帮助诊断发生问题时的PCIe状态。

附加硬件错误信息的字段格式(图234)

字节范围 描述
01:00 PCIe设备状态寄存器:包含PCI设备状态寄存器的内容,用于描述PCIe错误发生时的状态。

Endurance Group Critical Warning Condition(错误代码07h)

此事件表示NVM子系统检测到的耐久性组(Endurance Group)发生了关键警告。警告可能来自多个硬件和系统状态,例如容量耗尽或故障等。

  • 附加硬件错误信息:该字段提供有关发生此事件的耐久性组标识符。详细信息见下表。
字节 描述
0 使用与Endurance Group Information日志相同的格式设置该字段,指示发生错误的条件。
1 保留
3:2 设置为关联的耐久性组的Endurance Group Identifier。

总结

  • NVM子系统硬件错误事件提供了硬件故障的详细信息,涉及PCIe链路、媒体完整性等重要部分。
  • 错误类型涵盖可修正和不可修正错误,以及关键警告,例如设备未安全关闭(Unsafe Shutdown)或控制器无法在预定时间内准备好(Controller Ready Timeout)。
  • 附加硬件错误信息字段提供了额外的详细数据,帮助进一步分析错误源头,尤其是在PCIe设备的状态中。

通过这些事件,系统能够更好地诊断和处理硬件问题,确保数据完整性和设备的长期稳定运行。