命名空间管理 - 🌟 NVM 子系统重置(NVM Subsystem Reset) (第129页)
NVME2.0协议解读 1 min read

命名空间管理 - 🌟 NVM 子系统重置(NVM Subsystem Reset) (第129页)

Blog Author

以下是对 《NVM Express® Base Specification, revision 2.0b》第118页NVM 子系统重置(NVM Subsystem Reset) 的深入分析与学习讲解,涵盖 单域与多域子系统重置 的不同处理方式。


🌟 NVM 子系统重置(NVM Subsystem Reset)

单域 NVM 子系统重置(Single Domain NVM Subsystems)

单域子系统重置的触发条件

在不支持多域的 NVM 子系统中,NVM 子系统重置将影响整个子系统,即所有控制器、内存区域以及传输通道都会被重置。

触发条件: 1. 主电源接通:当主电源为 NVM 子系统供电时,NVM 子系统将进行重置。 2. 写入特定值:向 NSSR.NSSRC 字段写入值 4E564D65h(即“NVMe”)。 3. NVMe 管理接口请求:通过 NVMe 管理接口发起的重置请求。 4. 厂商特定事件:在发生厂商特定的错误事件时,NVM 子系统会触发重置。

重置后的行为

  • 控制器级重置:对所有控制器执行控制器级重置(Controller Level Reset)。
  • 持久内存区域禁用:禁用与所有控制器关联的持久内存区域。
  • 传输特定操作:执行适用于当前传输标准的特定操作(如 PCIe、Fabrics 等)。

NVM 子系统重置的报告

  • NVM 子系统重置发生时,会通过 CSTS.NSSRO 字段的初始值报告。主机软件可以通过该字段确定失去与控制器的通信是由于 NVM 子系统重置,还是由于其他原因。

主机发起 NVM 子系统重置

  • 主机可以通过写入 NSSR.NSSRC 字段来发起 NVM 子系统重置,这取决于控制器是否支持该功能。控制器是否支持此功能由 CAP.NSSRS 字段指示。

厂商特定事件导致的重置

  • 如果发生严重的硬件或固件错误(例如致命故障),可以通过厂商特定事件触发 NVM 子系统重置,以便恢复子系统的正常操作。

多域 NVM 子系统重置(Multiple Domain NVM Subsystems)

在支持多个域的 NVM 子系统中,NVM 子系统重置的范围取决于是对单一域进行重置,还是对整个子系统进行重置。

多域子系统重置的触发条件

  1. 域的电源接通:为特定域提供电源时,触发域级重置。
  2. 写入特定值:向特定域中的控制器的 NSSR.NSSRC 字段写入值 4E564D65h(即“NVMe”)。
  3. 厂商特定事件:域内发生厂商特定的事件,导致该域重置。

域级 NVM 子系统重置后的行为

  • 控制器级重置:对域内所有控制器执行控制器级重置。
  • 持久内存区域禁用:禁用与该域内所有控制器关联的持久内存区域。
  • 传输特定操作:执行适用于当前传输标准的特定操作。

子系统范围的 NVM 子系统重置

  • 如果 NVM 子系统支持多个域,NVM 子系统重置 也可能作用于整个子系统,这时会影响所有域中的控制器。

重置后的报告

  • CSTS.NSSRO 字段会报告域级 NVM 子系统重置时的初始状态。主机可以根据该字段来判断失去与控制器的通信是否因域级重置所致。

🧠 理解 NVM 子系统重置的重要性

为什么需要区分单域与多域的子系统重置?

  1. 子系统级别的重置:单域子系统重置将影响整个子系统的所有控制器,而多域子系统可以选择性地对特定域进行重置,而不是全局重置。这使得多域子系统在面对部分控制器故障时更具灵活性。
  2. 高可用性与故障隔离:通过支持多域子系统,NVM 设备可以在发生某些故障时,仅重置相关域,从而避免影响整个子系统的正常运行,提高了系统的可用性和容错能力。
  3. 恢复机制:NVM 子系统重置可用于从严重硬件或固件错误中恢复,确保数据的完整性和系统的健康。

📘 关键点总结

内容 要点
单域 NVM 子系统重置 重置整个 NVM 子系统,包括所有控制器和持久内存区域。触发方式包括电源接通、写入特定值或厂商事件。
多域 NVM 子系统重置 支持选择性地重置特定域或整个子系统,提高系统的灵活性和容错性。
CSTS.NSSRO 字段 报告重置的初始状态,帮助主机判断是否由于重置失去与控制器的通信。
厂商特定事件 可用于恢复从致命硬件或固件错误中恢复系统,确保系统稳定性。

如果你希望继续深入研究 NVM 子系统重置 的具体实现细节,或了解 厂商特定事件 如何影响重置过程,欢迎随时告诉我!