数据结构 - NVM子系统硬件错误事件代码(图233) (第221页)
NVM子系统硬件错误事件代码(图233)
NVM子系统硬件错误事件提供了有关硬件故障和关键警告条件的信息。以下是不同错误事件的详细说明:
错误事件代码及描述
| 错误代码 | 错误类型描述 |
|---|---|
| 07h | Endurance Group Critical Warning Condition:表示NVM子系统检测到条件,导致Endurance Group Information日志中的Critical Warning字段被设置为‘1’。 |
| 08h | Unsafe Shutdown:表示在SMART/健康信息日志中的Unsafe Shutdowns字段被递增,指示设备在断电时未安全关闭。 |
| 09h | Controller Fatal Status:表示控制器的Fatal Status (CSTS.CFS)位被设置为‘1’,意味着控制器处于严重故障状态。 |
| 0Ah | Media and Data Integrity Status:表示完成队列条目包含的媒体和数据完整性状态码(例如,非86h或87h)。 |
| 0Bh | Controller Ready Timeout Exceeded:表示控制器未能在规定的时间内准备好处理命令,或者至少一个命名空间未准备好以处理管理员命令。 |
| 0Ch to FFh | 保留:这些错误代码未定义。 |
附加硬件错误信息(图234)
某些硬件错误类型可能包含附加信息,以便更详细地描述发生的错误。例如:
- PCIe错误(例如,可修正的或不可修正的错误)将包括PCIe设备状态寄存器的内容。该寄存器的值用于帮助诊断发生问题时的PCIe状态。
附加硬件错误信息的字段格式(图234)
| 字节范围 | 描述 |
|---|---|
| 01:00 | PCIe设备状态寄存器:包含PCI设备状态寄存器的内容,用于描述PCIe错误发生时的状态。 |
Endurance Group Critical Warning Condition(错误代码07h)
此事件表示NVM子系统检测到的耐久性组(Endurance Group)发生了关键警告。警告可能来自多个硬件和系统状态,例如容量耗尽或故障等。
- 附加硬件错误信息:该字段提供有关发生此事件的耐久性组标识符。详细信息见下表。
| 字节 | 描述 |
|---|---|
| 0 | 使用与Endurance Group Information日志相同的格式设置该字段,指示发生错误的条件。 |
| 1 | 保留 |
| 3:2 | 设置为关联的耐久性组的Endurance Group Identifier。 |
总结
- NVM子系统硬件错误事件提供了硬件故障的详细信息,涉及PCIe链路、媒体完整性等重要部分。
- 错误类型涵盖可修正和不可修正错误,以及关键警告,例如设备未安全关闭(Unsafe Shutdown)或控制器无法在预定时间内准备好(Controller Ready Timeout)。
- 附加硬件错误信息字段提供了额外的详细数据,帮助进一步分析错误源头,尤其是在PCIe设备的状态中。
通过这些事件,系统能够更好地诊断和处理硬件问题,确保数据完整性和设备的长期稳定运行。