数据结构 - NVM子系统硬件错误事件(Event Type 05h) (第220页)
NVME2.0协议解读 1 min read

数据结构 - NVM子系统硬件错误事件(Event Type 05h) (第220页)

Blog Author

NVM子系统硬件错误事件(Event Type 05h)

NVM子系统硬件错误事件记录NVM子系统检测到的硬件错误类型。通过这个事件,系统可以跟踪PCIe错误、链路状态变化等硬件故障,并进行进一步分析和处理。此类事件对于设备维护和问题诊断至关重要,能够帮助识别底层硬件问题。

NVM子系统硬件错误事件格式(Event Type 05h)

事件的格式如下所示:

字节范围 描述
01:00 NVM子系统硬件错误事件代码:此字段包含一个代码,指示正在报告的硬件错误类型。 参见图233了解具体错误类型。
03:02 保留:预留字段,未使用。
M+3:04 附加硬件错误信息:此字段包含关于硬件错误事件的附加信息。M表示附加信息字节数。如果没有附加信息,则该字段被省略。

NVM子系统硬件错误事件代码(图233)

此字段的值指示具体的硬件错误类型,具体包括:

错误代码 错误类型描述
00h 保留
01h PCIe可修正错误:表示检测到PCIe可修正错误。
02h PCIe不可修正非致命错误:表示检测到PCIe不可修正非致命错误。
03h PCIe不可修正致命错误:表示检测到PCIe不可修正致命错误。
04h PCIe链路状态变化:表示PCIe链路状态寄存器值发生变化,通常由于尝试修复不稳定的链路操作。
05h PCIe链路未激活:表示PCIe链路控制和管理状态机未能保持链路激活状态。
06h 临界警告条件:表示NVM子系统检测到的条件,导致SMART/健康信息日志中的临界警告字段被设置为‘1’。

附加硬件错误信息

某些错误类型可能会包含附加硬件错误信息,该信息格式依据具体错误代码而有所不同。例如:

  • PCIe可修正错误(01h)PCIe不可修正非致命错误(02h)PCIe不可修正致命错误(03h) 等,都可能会返回附加的硬件错误信息,这些信息具体格式见图234

  • PCIe链路状态变化(04h):当链路状态发生变化时,附加信息字段将保存PCIe链路状态寄存器的内容。

  • 临界警告条件(06h):如果发生了与临界警告相关的错误,附加信息字段将使用与SMART/健康信息日志中的临界警告字段相同的格式记录。

总结

  • NVM子系统硬件错误事件是用于记录与硬件相关的各种故障信息,尤其是PCIe链路错误、硬件警告等。
  • 错误类型包括可修正错误不可修正错误,对于每种错误类型,系统可能会提供附加的硬件错误信息,以便进一步分析和调试。
  • 这些事件有助于在系统发生硬件问题时进行及时诊断,确保设备的可靠性和稳定性。

通过理解这些事件,您可以更好地跟踪硬件的状态,并采取必要的措施进行修复或预防。