Pocit měsíce

Lidé jsou sami, protože staví zdi místo mostů.
(Joseph F. Newton)

neděle 15. července 2012

Shrnutí uplynulého týdne (27.)

Toto shrnutí bude hodně technické, o WAN, linkách, serverech a stanicích :-)

Díky víkendovým bouřkám bylo pondělní ráno krušnější, než je zvykem. Postupně přicházely hovory z jednotlivých poboček, bohužel nebo bohudík přišly v pořadí  pobočka P*, pobočka F*, a až dlouho poté pobočka B*. Pobočku P* jsem vzal přednostně, protože hláška "nejde nic" byla podezřelá a pobočka F* hlásila "nejde nám WAN"...

Hloupé bylo, že jsem si u pobočky B* stopl naše služební auto, které jelo na pobočku F*, tam jsem si auto půjčil a přejel na P* a až tam mě zastihlo volání z pobočky B*, kde naštěstí jen padl řídicí počítač řídící výdej pořadových lístků, musel jsem tedy po telefonu navést kolegyni, která měla odvahu mi zavolat, aby jej nahodila...

Ale to, co se dělo na pobočkách F* a P* nechápu doteď. V neděli ve 14 hodin, tedy hodně dlouho po sobotní pozdně noční bouřce, se najednou zdvihl provoz tak, že zahltil 1 Mbit. linku vedoucí na každou z poboček a ten provoz tak vytěžoval linku, že příchozí data využila celou kapacitu linky. Běhal jsem kolem linek celé dopoledne, dělal psí kusy, ale nechápal to, kde se to bere. Nakonec jsem to předal v pondělí cca v 11 hodin odborníkům síťařům z Brna.

Ti si to předávali mezi sebou jako horký brambor, až v úterý v 11 hodin konečně kdosi zapl na našich CISCO routerech sledovačku (my "dole" toto nemůžeme, nemáme hesla), kdy už jsem supěl vzteky, protože obě linky byly i v noci z pondělka na úterý  přetížené, přesně o půlnoci sem si vycvaknul graf přenosů....

Nakonec pro pobočky P*, F* a dokonce i A* (kde byla přes půlnoc přetížená dokonce 8Mbit linka) stanovena jedna IP adresa z vnitřní sítě daných poboček, kterou daný technik označil jako TOP stahovače. Prý všechny tři IP adresy se dobývali na server Symantecu, aby si stahly MSI balíček nové verze. To mě krutě zasáhlo - Na pobočce F* jedou přes noc 3 servery a 2 stanice, přičemž jedna ze stanic se má starat o tyto věci kolem antivirů, má stahovat věci o které je ostatní požádají. Technik na chvilku vypnul jeden ze serverů, co podle IP adresy byl onen stahovač a zatížení linky spadlo. Po nahození serveru se potíže neobjevily. To na pobočce P* také jely 3 servery a měly jet jen dvě stanice a za stahovače byla označena právě ta stanice, která má stahovat tyhle antivirové věci. A zde to nechápu úplně nejvíc. Pokud se tato stanice rozhodla pro ostatní stáhnout 300MB MSI balíček (nebo dva balíčky, pokud je serverová edice antiviru jiná), proč to dělala tak nešikovně, že vyvolávala tak příšerně moc přenosů, že blokla linku a tím následně i sama sebe? Každopádně jsem proběhal v úterý večer pobočku P* od sklepa až po půdu a povypínal jsem vše, co mi přišlo pod ruku. Když se na grafu přenosů blížila hodnota limitně nule, opatrně jsem pustil postupně ony 3 servery, ale před nimi ještě tu staničku co má stahovat ony updaty a mnohem později další 2 PC. Linka se znovu na 15 minut vytížila, ale pak to dalo pokoj.... Bonusem byla pobočka A*, kde TOP stahovačen byl označen zapnutý notebook kolegy, který u nás už 2 dny nepracuje. Notebook odpojen dalším z kolegů, ale linka je přetížena stále...

Na lince pobočky A* datový bordel pokračoval i ve středu, ale milá firma, která mi to měla diagnostikovat jakoby označovala počítače, které zas až tak nedělaly takový bordel, takže jsem to vzal do svých rukou a úderem 18-té hodiny začal na všechny naše IP adresy vysílat požadavek Shutdown a klientské staničky začaly poslušně vypínat. Samozřejmě jako první vypnula stanice, ze které jsem řídil to vypínání :-) Takže nahodit, a pustit vypínání znovu, tentokrát s časovým limitem, abych zavčasu zachytil další pokus o vypnutí sama sebe ... Když bylo po celém baráku ticho, podíval jsem se na graf vytížení linky a nic. Bylo jasné, že datový bordel dělá jeden z deseti serverů pobočky A*, otázkou bylo, který. Vyslal jsem opět dálkový vypínací pokyn, a část serverů poslušně vypnula, část mě ignorovala, takže jsem je začal vypínat ručně. Když už zbývaly poslední tří (server intranetu, zcela nový a zatím prázdný server a doménový řadič), graf ukazující přetížení linky prudce spadl dolů. Vypnul jsem i ty tři zbývající (dva z nich stejnak chtěly restart kvůli nějakému updatu z Microsoftu) a užil si chvilku ticha. A začal po dvojicích servery najíždět, každou dvojici s následnou pětiminutovou pauzou, abych měl jistotu, že to nedělá některý z té dvojice a že oboum serverům najely všechny služby. Z počátku to byla nuda, protože jsem úmyslně najížděl nejprve ty servery, u nichž jsem předpokládal, že to nedělají. A opravdu nedělaly. Pak to přišlo - sešla se mi dvojice serverů, které interně nazývám Špeh a Smetiště (přičemž na Špehovi nemáme plná adminská práva) a graf vylétl nahoru. Než se mi podařilo napojit notebook s WhiteSharkem a spustit sledovačku, bylo po všem, graf zase začal ukazovat normálnější provoz. Zbylé servery si sice také udělaly vlnku v grafu zatížení linky, ale to jen díky tomu, že Symantecové mezitím vydali nějaký update antivirových definic a každý ze serverů byl malinko jiný (různé kombinace 32/64bit , W2k3/W2k8, SP1,2,3, SR2/normal ...), takže byl potřeba pokaždé malinko jiný balíček definic...

Čtvrtek, pátek a sobotu jsem doma a snažím se dostřihávat videa a doplňovat web. Škoda, že jsem byl nucen řešit problémy typu "nekomunikace, nezvládnutá komunikace, lži, diplomatické lži"... Tak jako se mi v práci nahromadily problémy na třech linkách, i tyto problémy se sešly ve skupince.

Úplně nejhorší jsou lži, kdy vám dotyčný zapře něco zcela zjevného nebo dokonce dokazatelného. Ale co už....

Neděle byla vyhrazena celodennímu hraní jistého světa v dračím doupěti. Když shrnu peripetie své postavy elfa - dvakrát rozpůlena sekerou, jednou pád do 30metrové trhliny, dva "fatály fatálů" okamžitě za sebou při kouzlení zachraňující životy, trpsličí férovka 11 na pět elfů, usmažení blesky od kouzelníka ... Vše přežito za pomocí druidů ..., ale bavili jsme se při hře dost a dost :-)