Posted By: Pindagi (Maly a vysmaty ;-)) on 'CZunix'
Title:     Re: SAN monitoring
Date:      Tue Oct 14 17:03:36 2014

Udelal bych ten upgrade firmware a driveru tech qlogicu. 
Podobny problem jsem nasel na supportu redhatu:

https://bugzilla.redhat.com/show_bug.cgi?id=643933

kde doporucuji v podstate totez.

V pripade ze to nepomuze klidne se ozvi muzeme se pak podivat co s tim dal.



> > problemu muze bejt mraky. Zacinal bych analyzou logu primo na swistich,
> > pokud 
> > mate Brocade (coz predpokladam) nemel by to byt problem. Pokracoval revizi
> 
> > zonovani a lun mapingu. Brocady maji peknou podporu SNMP, ktaze posbiranim
> 
> > spravnejch dat a porovnanim je s pruserovym casem by se melo dat zjistit
> kdo
> 
> Switche tu jsou Brocade, ale nemam k nim pristup, takze bych to musel
> domluvit 
> se sitarema a musel bych vedet co sledovat. 
> 
> > na co pristupuje. Dalsi prima tool kterej by ti moh poct je na host strane
> 
> > sar -A + ksar kterej kresli pekny grafy a kde je fajn si vsimat hodnot
> > awwait 
> > a awserv (cekani na pozadavek a doba zpracovani). Taky bych si prosel 
> 
> Pri problemech se v messages objevuji tahovehle hlasky :
> kernel: qla2xxx [0000:05:00.0]-801c:1: Abort command issued nexus=1:1:17 -- 
> 1 
> 2002.
> v iostat vyskoci %util na 100, nekde naroste svctm a pak v podstate
> prestanou 
> diskove operace a util nekterych disku zustane na 100. Ve vetsine pripadu se
> 
> psk diskove operace rozbehnou, pokud to trva dyl nez minutu, tak server 
> vetsinou sestreli clusterware, ktery se stara o ocfs2 sdilene uloziste. 
> 
> > konfiguraci jednotlivych raidu na poli a logickych disku. TReba na
> midrange 
> > od IBM je to delano tak ze mas jeden raid a nd nim tvoris konkretni luny 
> > ktere pak mapujes na dalsi hosty. Pokud ti jeden raid vyuziva vice hostu
> tak
> > pak je na problem zadelano. Dalsi hint - zkontrolovat na poli preferovane 
> > cesty - muze bejt pretizenej kontroler. BTW jake tam mate pole ? Pokud 
> > nevykoumate kde by ten problem moh bejt zacal bych s patchovanim....
> > Objevuje 
> > se problem pouze na jednom hostu nebo na vice hostech ?
> 
> Projevuje se to na vice serverech a diskove pole mame 2xHP EVA 4400, nekolik
> 
> starsich HP MSA a pak SW pole s SSD disky.
> Vetsina LUNu je samozrejme sdilena pro vice serveru. 
> 
>                                         Libor Vejpustek
>                                         Ceska zemedelska univerzita Praha
> http://web.czu.cz/~vejpuste/            E-mail : vejpuste@uvt.czu.cz
co ja vim

Search the boards