判断

标准

判断方式

注意事项

端口出现过闪断记录

方式1:导出iBMC历史告警,提取描述中错误码后四位为8603的闪断告警。

方式2:通过hccn_tool -i device_id -link_stat -g命令收集闪断记录。

  • 出现端口闪断不一定是脏污,也可能是关机、重启、NPU丢卡,插拔线等其他原因。
  • 脏污会导致收光功率低,端口产生错误码。
  • 端口闪断是整条链路的问题,需要将收发两端的设备收发光情况综合考虑。

收光功率低

通过带外iBMC日志分析收光功率周期统计数据。

误码率增加

通过hccn_tool -i device_id -reg -a 0x1060446c命令收集错误码。

参考:Atlas 800T A2 训练服务器 用户指南 11 - 华为

Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐