光纖交換機(jī)端口故障的排查方法
1、定位問題
設(shè)備正常狀態(tài)下通過switchshow可以看到狀態(tài)是online、設(shè)備的WWN(L_Port和NPIV除外)和端口類型。
使用admin用戶登錄交換機(jī)
輸入switchshow檢查設(shè)備端口的狀態(tài)是否是online
輸入portcfgshow,檢查端口配置是否正常
輸入porterrshow,檢查端口錯(cuò)誤計(jì)數(shù)器是否正常
輸入portlogdump port,檢查端口login相關(guān)日志,重點(diǎn)是event(SPEE、INTR)和CMD(NC、AC)
Brocade_5300:admin> switchstatusshow【查看整個(gè)交換機(jī)的狀態(tài)】
Brocade_5300:admin> portcfgshow
默認(rèn)情況端口速率和端口類型初始化都是自適應(yīng)(portcfgspeed可以查看端口速率)。如果端口有鎖定為L(zhǎng)_Port,那么這個(gè)端口就只能用于連接loop類型設(shè)備,可以通過portcfgdefault重置端口。
Brocade_5300:admin> porterrshow
檢查輸出結(jié)果是否有較高的error計(jì)數(shù)器(比如CRC錯(cuò)誤或者ENC_OUT錯(cuò)誤),只有在不停穩(wěn)步增長(zhǎng)的錯(cuò)誤才能確認(rèn)鏈路有問題。一般可以5分鐘看一次。
Tx和Rx分別代表發(fā)送和接受的幀數(shù)量
Crc_err代表CRC校驗(yàn)錯(cuò)誤的幀數(shù)量。如果這個(gè)錯(cuò)誤數(shù)量一直在上升,那么這個(gè)鏈路應(yīng)該有物理故障。需要檢查光纖線,SFP,HBA卡等。
8GB平臺(tái)請(qǐng)先檢查portcfgshow里面fill word是否是3。
Enc_out錯(cuò)誤與幀本身沒有關(guān)系,通常代表代表一個(gè)primitive signal或者sequence有錯(cuò)誤。通常確認(rèn)是否光纖線有問題的方法是5-10分鐘抓取一次porterrshow結(jié)果,如果看到crc_err計(jì)數(shù)器一直上升,那么光纖線或者HBA卡有硬件問題。
Disc_c3代表class 3類型FC幀有丟包現(xiàn)象,一般是由于幀在交換機(jī)buffer里面超時(shí)導(dǎo)致。當(dāng)ISL鏈路過載或者不穩(wěn)定時(shí)候會(huì)有這個(gè)問題。
一般結(jié)合兩個(gè)或者兩個(gè)以上錯(cuò)誤指標(biāo)來診斷問題,必要時(shí)候需要參考portstatsshow結(jié)果。
Brocade_5300:admin> portstatsshow 0
Brocade_5300:admin> portlogdump 0 |grep -E "SPEE|INTR"
如果有event是pstate并且cmd是AC這行,那么代表端口初始化成功。初始化成功后,設(shè)備要么是F_Port或者E_Port取決于端口的另外一端設(shè)備。
如果端口對(duì)端是主機(jī)或者存儲(chǔ),那么端口就是F_Port;如果是另外一臺(tái)交換機(jī),那么端口就是E_Port