Posted By: Pindagi (Maly a vysmaty ;-)) on 'CZunix' Title: Re: SAN monitoring Date: Tue Oct 14 17:03:36 2014 Udelal bych ten upgrade firmware a driveru tech qlogicu. Podobny problem jsem nasel na supportu redhatu: https://bugzilla.redhat.com/show_bug.cgi?id=643933 kde doporucuji v podstate totez. V pripade ze to nepomuze klidne se ozvi muzeme se pak podivat co s tim dal. > > problemu muze bejt mraky. Zacinal bych analyzou logu primo na swistich, > > pokud > > mate Brocade (coz predpokladam) nemel by to byt problem. Pokracoval revizi > > > zonovani a lun mapingu. Brocady maji peknou podporu SNMP, ktaze posbiranim > > > spravnejch dat a porovnanim je s pruserovym casem by se melo dat zjistit > kdo > > Switche tu jsou Brocade, ale nemam k nim pristup, takze bych to musel > domluvit > se sitarema a musel bych vedet co sledovat. > > > na co pristupuje. Dalsi prima tool kterej by ti moh poct je na host strane > > > sar -A + ksar kterej kresli pekny grafy a kde je fajn si vsimat hodnot > > awwait > > a awserv (cekani na pozadavek a doba zpracovani). Taky bych si prosel > > Pri problemech se v messages objevuji tahovehle hlasky : > kernel: qla2xxx [0000:05:00.0]-801c:1: Abort command issued nexus=1:1:17 -- > 1 > 2002. > v iostat vyskoci %util na 100, nekde naroste svctm a pak v podstate > prestanou > diskove operace a util nekterych disku zustane na 100. Ve vetsine pripadu se > > psk diskove operace rozbehnou, pokud to trva dyl nez minutu, tak server > vetsinou sestreli clusterware, ktery se stara o ocfs2 sdilene uloziste. > > > konfiguraci jednotlivych raidu na poli a logickych disku. TReba na > midrange > > od IBM je to delano tak ze mas jeden raid a nd nim tvoris konkretni luny > > ktere pak mapujes na dalsi hosty. Pokud ti jeden raid vyuziva vice hostu > tak > > pak je na problem zadelano. Dalsi hint - zkontrolovat na poli preferovane > > cesty - muze bejt pretizenej kontroler. BTW jake tam mate pole ? Pokud > > nevykoumate kde by ten problem moh bejt zacal bych s patchovanim.... > > Objevuje > > se problem pouze na jednom hostu nebo na vice hostech ? > > Projevuje se to na vice serverech a diskove pole mame 2xHP EVA 4400, nekolik > > starsich HP MSA a pak SW pole s SSD disky. > Vetsina LUNu je samozrejme sdilena pro vice serveru. > > Libor Vejpustek > Ceska zemedelska univerzita Praha > http://web.czu.cz/~vejpuste/ E-mail : vejpuste@uvt.czu.cz co ja vim