Připravte se také na katastrofy při přenosu dat

1. 12. 2002

Sdílet

Manažeři společnosti Eastman Chemical z Kingsportu ve státě Tennesee si uvědomili, že při obnově v případě katastr...

Manažeři společnosti Eastman Chemical z Kingsportu ve státě Tennesee si

uvědomili, že při obnově v případě katastrofy je třeba vzít v potaz též

vzdálenost a problémy s transportem.

Společnost má dvě zálohovací centra, jedno v IBM v Gaithersburgu ve státě

Maryland, druhé v Sungard Data Systems v Atlantě. „Dvakrát do roka nahrajeme

data na pásky a ty odešleme do těchto center,“ říká Charlie Oliver, ředitel

globálních infrastrukturních služeb Eastman Chemical. Nicméně ještě před tím,

než tragédie z 11. září 2001 uzavřela většinu transportních tepen, bylo

Oliverovi jasné, že toto řešení není adekvátní.



Nová vize

Počátkem roku 2001 získal svolení managementu k vybudování dalšího střediska,

vzdáleného 30 km od ústředí v Johnson City. Nové centrum bylo spuštěno v březnu

2002. Chemická společnost si zvolila hardware Symmetrix od EMC a software EMC

Symmetrix Remote Data Facility, který je propojen telekomunikačním vedením

Dense Wave Division Multiplexing.

Oliver říká, že architektura znamená víc než jen zajištění kontinuity firemního

provozu. „Replikujeme všechny své ERP a další kritické systémy, nicméně zároveň

se snažíme dosáhnout mezi oběma centry vyváženosti tak, aby jedno nebylo pouhou

zálohou druhého.“



Zlepšení služeb

Provoz dvou aktivních, vyvážených center přináší lepší zákaznické služby.

„Většinu rutinních selhání teď naši klienti vůbec nepostřehnou, jelikož

transakce mohou být automaticky přepnuty na druhé centrum. Díky tomu můžeme

nabízet neobyčejnou dostupnost,“ říká Oliver. Vysoká dostupnost je zajímavým

vedlejším přínosem, nicméně podle Olivera je nejdůležitější brát při výstavbě

nového systému pro zajištění kontinuity provozu firmy v úvahu charakter reálné

katastrofy.



Zadní vrátka

„Často slyším, jak někdo říká: Dokážeme obnovit naše prostředí během 24 až 48

hodin, nicméně vůbec nemyslí na to, že by mohly selhat i jiné jejich služby.

Spousta mých kolegů spoléhá na to, že by mohli v případě katastrofy odlétnout

do nějakého vzdáleného místa, nicméně tento čas je třeba též přičíst k času na

obnovu, proto je nutné brát v potaz, kde je zařízení umístěno,“ varuje Oliver.



Klonování dat pro obnovu po havárii

Firmy usilují o skloubení svých úložných a obnovovacích strategií

prostřednictvím replikace dat. Dokonce ještě před teroristickými útoky z 11.

září 2001 a krizí amerických leteckých společností začali IT manažeři používat

výrazů jako „disaster recovery“ (obnova po katastrofě) a „storage“ (ukládání) v

jedné větě, zejména pak v oblasti finančních služeb.

Po útocích nicméně požadavek na skloubení obou disciplín působil ještě

naléhavěji. Možnost katastrofy byla najednou mnohem reálnější a dřívější plány

ochrany dat (jako odesílání fyzických pásek leteckou poštou na vzdálené místo)

najednou působily značně naivním dojmem. Výsledkem je to, že slova „disaster

recovery“ neboli obnova po katastrofě či havárii dnes určují směr mnoha

projektů v oblasti úložných technologií, neboť IT manažeři hledají způsoby, jak

data replikovat a kopie odesílat do zařízení, jež budou vzdálená deset, dvacet

nebo dokonce stovky kilometrů od ústředí společnosti. Zde jsou tři

technologické strategie, kterých používají:



1. Přístup na základě subsystému pro ukládání dat

Když Lajuana Earwoodová začala hledat nový systém pro obnovu v případě havárie,

zjistila, že je ve svém úsilí vlastně osamocena. „O něco podobného jako my se

nikdo nepokoušel chtěli jsme dokázat zrcadlení velkých datových objemů na velmi

dlouhou vzdálenost, na více než 1 000 kilometrů,“ říká. L. Earwoodová,

ředitelka pro mainframové systémy ve společnosti Norfolk Southern Railway v

Norfolku ve státě Virginia, si v lednu 2001 uvědomila, že počítačové systémy

velkých firem jsou značně zranitelné. „V té době jsme měli k dispozici

replikaci malého objemu dat v reálném čase, nicméně to by v případě větší

katastrofy stejně nebylo dostačující,“ říká Earwoodová. Data dosahovala objemu

6 TB kritických informací o železnici, výplatních listinách a objednávkách,

přičemž byla uložena na dvou mainframových počítačích IBM v zásadě tvořily IT

rozbočovač železniční společnosti. A tak Earwoodová oslovila všechny velké

poskytovatele zařízení pro ukládání dat: vítězem výběrového řízení se v únoru

2001 stala společnost Hitachi Data Systems z kalifornské Santa Clary. „Návrh

IBM by vyžadoval příliš dodatečného hardwaru, stejně neuspokojivé se nám jevilo

řešení EMC HDS nám předložila řešení, jež se asi nejvíc blíží zrcadlení v

reálném čase a navíc vyžaduje méně hardwarového vybavení.“ A také cena byla

příznivá. Nový systém byl spuštěn v lednu 2002. V průběhu instalace nicméně

došlo k jedné výrazné změně plánu. Původně se měla data replikovat do zařízení

umístěného v North Bergenu, stát New Jersey, zhruba 1 100 kilometrů od ústředí

firmy. „Ale po teroristických útocích 11. září nám došlo, že to není zas tak

dobrý nápad. Problémy spojené s přepravou personálu by mohly v podstatě zničit

všechny naše snahy,“ říká Earwoodová. A tak se firma Norfolk Southern rozhodla

pro mnohem bližší zálohovací centrum pro zrcadlení mainframových dat v

Buckheadu. Další překážku představoval čirý objem dat. „Chtěli jsme všechna svá

data shromáždit do jedné konzistentní skupiny,“ říká Earwoodová. Konzistentní

skupina je sada dat sdílených několika kritickými aplikacemi, ovšem v případě

společnosti Norfolk Southern jsou všechna data sdílena všemi aplikacemi. Na

papíře to smysl dávalo, nicméně při samotné realizaci se ukázaly hranice

technologie.„

"Pro ukládání dat používáme hardware HDS 9960, replikační software HDS TrueCopy

a dvě síťová vedení OC3,“ vysvětluje Earwoodová. „Všechno to fungovalo, nicméně

u zápisu vysokých objemů transakcí jsme dosahovali stropu.“ Řešením bylo data

rozdělit do třech konzistentních skupin, nicméně Earwoodová přesto nevzdává

svůj originální plán: „Zkoušíme nový hardware od HDS, který bude s to zvládat

větší objemy. To by nám mohlo umožnit zkonsolidovat všechna naše data zpět do

jedné konzistentní skupiny,“ říká. Earwoodová testuje systém pomocí simulované

katastrofy téměř každý týden. „Dobu obnovy se nám podařilo snížit na téměř

čtyři hodiny, takže mám pocit, že teď už klidně můžeme předstoupit před vedení

společnosti a zodpovědně prohlásit, že máme k dispozici dobrý systém pro obnovu

dat v případě katastrofy.



2. Hostované softwarové řešení

Když Chadd Warwick, provozní ředitel společnosti Comprehensive Software

Systems, což je firma zabývající se vývojem finančního softwaru sídlící v

coloradském Goldenu, vybíral nový systém pro zajištění firemní kontinuity,

chtěl něco flexibilnějšího než hardwarově založené systémy nabízené dodavateli

jako Hitachi či EMC. Požadované řešení našel v softwaru Veritas Volume

Replicator (VVR) od kalifornské společnosti Veritas Software. "VVR se nám

zamlouvalo, jelikož jde o hostované softwarové řešení,“ říká Warwick. Protože

software běží na serveru místo na jednom z disků, je nezávislý na systému pro

ukládání dat. „Díky tomu jsme nemuseli budovat novou hardwarovou

infrastrukturu, a tak jsme výrazně ušetřili,“ pochvaluje si Warwick. Warwick

začal VVR používat v listopadu roku 2001 jako betatester a rozhodl se u něj

zůstat. „Jde o replikaci po celých blocích, takže software nemusí vědět vůbec

nic o aplikacích ani o datech. A hardwarová nezávislost je skutečně velice

příjemná věc. Dokonce je možná obnova dat na jakýkoli hardware, takže v případě

nějaké závažné katastrofy by klidně bylo možné zaběhnout do obyčejného obchodu,

nakoupit jakékoli počítače a systém opět spustit.“ Další výhoda podle Warwicka

spočívá v absenci složitých specifických síťových protokolů. „VVR používá

standardní IP protokol,“ zdůrazňuje. V současné době společnost replikuje

zhruba 400 MB až 1 GB dat denně po linkách T1 a T3 z datového centra v Goldenu

do zařízení umístěného v Denveru. Softwarový přístup je obvykle levnější než

subsystémové produkty, zvláště v případě replikace na delší vzdálenost,

popisuje Bob Guilbert, viceprezident společnosti NSI Software z Hobokenu ve

státě New Jersey, která je konkurentem firmy Veritas. „Subsystémové produkty

obyčejně vyžadují pro přenos specializovaná vlákna, takže výsledná cena může

být velmi vysoká.“



3. Hybrid: SAN po IP

Jako mnoho jeho kolegů i Shimon Wiener začal hledat lepší způsoby ochrany dat

své firmy po teroristických útocích 11. září. Wiener je manažerem internetového

a síťového oddělení izraelské společnosti Miytachim, jednoho z nejvýznamnějších

poskytovatelů důchodového pojištění. A zrovna Izrael je místem světa, kde

katastrofy bohužel nejsou ničím vzácným. Firma má dvě datová centra: jedno se

600 MB v Ramat-Ganu, kde sídlí její ústředí, druhé o kapacitě 400 MB vzdálené

zhruba 10 km odtud v Tel Avivu. „Chtěli jsme dvojitou replikaci,“ říká Wiener,

„a to proto, že kdyby nám centrum v Tel Avivu selhalo, může jeho úlohu přejmout

centrum v Ramat-Ganu, a opačně.“ Nicméně když se Wiener vydal hledat

nejvhodnější řešení, zklamaly jej vysoké ceny. „Nejprve jsme se dívali na

Compaq (nyní HP), IBM a EMC. Žádná z těchto firem však nebyla s to nabídnout

řešení bez připojení optickým kanálem, což je v případě jeho použití velmi

nákladné.“

Wiener konečně našel to, co hledal, v produktu společnosti Dot Hill Systems z

kalifornského Carlsbadu. Společnost Miytachim chtěla mít na každém pracovišti

síť se systémem pro ukládání dat SAN se softwarem Axis Storage Manager od Dot

Hill, který podporuje IP replikaci pro systémy postavené právě na standardu

SAN. V lednu 2001 si penzijní společnost nainstalovala Dot Hill SANnet 7100 v

Ram-Gatu a druhý SANnet 7100 v Tel Avivu. Hned poté začala vzájemná replikace

mezi oběma centry. Testování trvalo zhruba čtyři týdny. „Původně jsme měli

jisté problémy se synchronizací obou systémů,“ říká Wiener, „nicméně dostalo se

nám dobré podpory a nyní jsme zcela spokojeni. Replikaci provádíme zhruba

jednou denně.“

Ačkoli hlavním cílem Wienera bylo získat systém pro obnovu dat v případě

katastrofy, říká, že zavedením nového řešení získali i další vedlejší výhodu.

„Použitím SAN se rovněž podařilo centralizovat data, takže se zálohami se

podstatně snadněji pracuje.“