Technická opatření
V sekci DOSTUPNOST jsme se zabývali obecně problematikou spolehlivosti (bezporuchovosti) a dostupnosti – zatím jednotlivých prvků systému. Pokusme se nyní na pojem dostupnosti podívat z praktického hlediska a říci si, jakou má vypovídací hodnotu pro člověka, který je mimo obor komunikačních systémů.

Srovnejme tři prvky a pro výpočet dostupnosti použijme již známý vzorec

DOSTUPNOST = MTBF / (MTBF + MTTR)

Prvek 1.
MTBF – 50 let = 438300 hod
MTTR –                             2 hod
DOSTUPNOST = 0,999995436936176

Prvek 2.
MTBF –   6 let = 52596 hod
MTTR –   5 dní =     120 hod
DOSTUPNOST = 0,997723651263374

Prvek 3.
MTBF – 2 roky = 17532 hod
MTTR –   5 dní   =     120 hod
DOSTUPNOST = 0,993201903467029

Ve všech případech se hodnota dostupnosti pohybuje přes 99% a mění se v lepším případě až na třetím místě za desetinnou čárkou. Tudíž použití hodnoty dostupnosti v této formě jako argument pro mladého perspektivního neklidného tabulkového managera (i starého a klidného) je naprostý nesmysl. Rozdíl v hodnotách je pod jejich rozlišovací schopností. Málo kdo je schopen vnímat, že tento drobný rozdíl může znamenat nedozírné škody na majetku i ztráty na životech.

Pojďme se tedy podívat, jak se to řeší ve světě.
Budu vycházet ze standardu mezinárodní asociace telekomunikací BICSI.
Standard ANSI/BICSI 00-2014 Data Center Design and Implementation. Ten pro vyjádření používá tři metody.

B -1
Dostupnost = čas provozu ve sledovaném intervalu / celkový čas sledovaného intervalu

B – 2 odpovídá našemu vzorci
Dostupnost = čas provozu / (čas provozu + čas mimo provoz)

B – 3
Dostupnost = čas provozu / (čas provozu + plánované prostoje + neplánované prostoje)

Výsledek je ve všech třech metodách velmi podobný. Změny jsou někde za desetinnou čárkou.

Na první pohled by se mohlo zdát, že američtí manageři budou vnímavější a budou chápat tyto rozdíly. Zřejmě to nebude pravda, protože uvedený standard následně za těmito výpočty zavádí klasifikaci tříd dostupnosti datových center (TIER 0 až TIER 4). Samozřejmě, že obdobný systém můžeme použít také.

Takovéto řešení má již daleko lepší vypovídací schopnost.
Samozřejmě, že se dá k danému problému přistoupit i z jiného hlediska.Definujme pojem poměrná dostupnost UT/DT.

proportional availability UT/DT = UpTime / DownTime

česky
poměrná dostupnost UT/DT = čas provozu / čas výpadku
Toto řešení udává počet hodin provozu na hodinu výpadku. Pro prvek 1 dle předcházejícího modelu je 219150hod., pro 2. prvek je 26298 hod. a pro 3. prvek je 8766 hodin. Zde jsou již vidět markantní rozdíly v hodnotách, které je schopen vnímat každý.
Další variantou je opačné vyjádření poměrné dostupnosti DT/UT přepočítané nejlépe na rok.

poměrná dostupnost DT/UT = čas výpadku / čas provozu
Toto řešení udává počet hodin výpadku na hodinu provozu. V tomto případě bude výhodnější přepočítat na výpadek za rok. U malých hodnot bude vhodné vyjádření v minutách.

poměrná dostupnost DT/UT/Y = čas výpadku / čas provozu x 365,23 x 24 x 60

První prvek by dosáhl hodnoty výpadku 0,04hod = 2,4min., druhý by měl hodnotu 20 hodin a třetí by dosáhl hodnoty 60 hodin. U obou variant docházíme ke způsobu vyjádření, který bude schopen vnímat i vrcholový manager a bude schopen (možná) na základě této informace rozhodovat. Samozřejmě, že v rámci vypočtených hodnot jsme schopni řadou organizačních opatření ovlivnit výsledek. Jde o změnu hodnoty MTTR, kterou jsme schopni právě vhodným organizačním opatřením výrazně snížit. Tím se budeme zabývat v samostatné sekci.

Nyní nám zbývá vyřešit jiný problém. Tím je dostupnost celého komunikačního systému a nejen jeho jednoho prvku.
Postupujme v úvahách od jednoduššího řešení k cílovému reálnému stavu.

V současné době zřejmě nebude existovat žádný komunikační systém, který by měl jediný prvek. V komunikačním systému budou zcela určitě zapojeny prvky kaskádovitě za sebou. Aplikujme toto tvrzení opět na model tří dříve definovaných prvků. Nejmenší hodnotu MTBF má 3. prvek – 2 roky. Současně má nejvyšší hodnotu MTTR – 120 hodin. Nejlepší prvek (první) má nejvyšší hodnotu MTBF – 50 let a nejnižší hodnotu MTTR – 2 hod. První poruchu této komunikační kaskády tedy přepokládáme po dvou letech a dobou opravy 120 hod.

V reálném životě jsou zákony, jejich platnost je neoddiskutovatelná. Osobně znám dva. Fyzikální zákony a Murphyho zákony.

Pokud budeme na modelový případ aplikovat 3. Murphyho zákon poruchy, který říká:
Pokud se muže i nemůže pokazit více prvků, zaručeně se pokazí v tom nejméně vhodném pořadí a čase“.

Z uvedeného vyplývá kritický stav, že ihned po opravě jednoho prvku se pokazí prvek druhý a po jeho opravě se ihned pokazí prvek třetí. Došlo tedy k součtu všech hodnot MTTR postavených k hodnotě MTBF nejhoršího prvku. Doba výpadku za rok by narostla 7260min. Postup součtu hodnot MTTR je analogický součtu hodnot odporů v sériovém zapojení.

Logickým závěrem je tedy konstatování, že při sériovém (kaskádovém) zapojení prvků nám klesá dostupnost. To je bohužel stav, který nejsme schopni nijak ovlivnit a můžeme se jej snažit technickými opatřeními pouze korigovat. Rovněž je vhodné volit do kaskády prvky s přibližně stejnou hodnotou MTBF.

Klíčovým technickým opatřením pro zvýšení spolehlivosti komunikačního systému je využití redundance v prvcích, linkách a všech jeho ostatních částech. Jedná se vlastně o paralelní řešení. Tato skutečnost mnohdy svádí k úvaze, že hodnota MTTR se bude snižovat na základě stejného výpočtu jako u paralelního zapojení odporů. Bohužel, není tomu tak. Čas potřebný na opravu prvku zůstane stejně dlouhý. Jediné co se snižuje při paralelním řazení, je pravděpodobnost výpadku systému. Pokud budeme mít dva stejné paralelní komunikační kanály, pravděpodobnost klesne na polovinu, pokud budou tři, tak na třetinu atd.

Problematikou redundantních řešení se zabývá právě tato sekce Technická opatření.