Sítě pro ukládání dat ve vývoji

1. 12. 2003

Sdílet

Je tomu už 9 let, co začal vývoj specifikace Fibre Channel, prvního rozhraní určeného k realizaci sítí pro ukládán

Je tomu už 9 let, co začal vývoj specifikace Fibre Channel, prvního rozhraní

určeného k realizaci sítí pro ukládání dat. Dnes však v podobě iSCSI stojí na

startovní čáře další architektura vhodná k budování storage sítí.

Koncept storage sítí se v současnosti vyznačuje tím, že zdroje pro ukládání dat

jsou propojeny prostřednictvím switchů, routerů nebo mostů přímo v síti. Tím se

liší dnes relativně stále ještě nový koncept storage sítí označovaný jako SAN

(Storage-Area Network) od dosud nasazovaných systémů DAS (Direct Attached

Storage), v jejichž případě jsou ukládací zařízení připojována přímo k

jednotlivým serverům.

Sítě SAN byly dosud využívány zejména proto, že jejich vybudování je podmíněno

vysokými počátečními náklady na hardware i zaškolení zaměstnanců především

podniky, které byly schopny dosáhnout vysoké návratnosti investic nebo

potřebovaly řešení, které dosud jinou technikou nebylo možné realizovat.

Dnešní SAN slouží především pro konsolidaci v oblasti ukládání dat, LAN-free

zálohování, virtualizaci storage, clustering, obnovu po havárii, jakož i pro

vzdálené ukládání a zálohování dat.



Konsolidace storage

Pod pojmem konsolidace storage se rozumí to, že subsystém pro ukládání dat může

být využíván různými servery. Z toho pak vyplývá redukce nákladů na hardware

pro ukládání, zmenší se potřebná plocha, kterou tato zařízení zabírají, a navíc

může být centralizována i zjednodušena správa. To má vliv také na snížení

běžných nákladů (především personálních) a významně lze redukovat i investice

do hardwaru. Při konsolidaci storage jsou používány koncepty, které mnohdy

mohou někomu připomínat dominantní pozici mainframů před 20 lety. Tentokrát je

pouze důležitým a ústředním faktorem v síti ukládání dat.

V případě LAN-free zálohování je zabezpečení přenosu dat uskutečněno nikoliv

prostřednictvím LAN, nýbrž právě přes SAN. Z toho vyplývá odlehčení samotné

LAN, a tím také propojení mezi klienty a servery, i serverových CPU. I zálohy

většího množství dat je pak možné provádět rychleji.



Virtuální ukládání

Virtualizace storage je označení používané pro oddělení dostupné kapacity

systémů pro ukládání dat od fyzicky existujících paměťových zařízení a jejich

disponibilní kapacity. Takto mohou být disková pole, a stejně tak jejich

atributy jako výkon, kapacita a stupně dalšího možného škálování odděleny od

pevného přiřazování či rozvržení storage. To dovoluje dynamické přidělování i

přesouvání potřebné kapacity bez přestavby hardwaru, ale také provoz bez

prostojů a plýtvání kapacitou. Virtualizace ukládání dat poskytuje lepší

kontrolu nad rostoucí dynamickou spotřebou storage kapacity.

Dosud bylo možné realizovat sítě SAN pouze s technologií Fibre Channel (FC).

Poté, co organizace Internet Engineering Task Force (IETF) ratifikovala v

polovině února 2003 standard iSCSI, objevila se spolu s ním možnost použít při

implementaci storage sítí ještě druhou techniku.

Nasazení technologie Fibre Channel je jednoduché i složité současně. V případě

FC jsou všechny vrstvy protokolu implementovány v hardwaru, aby šetřily CPU

zdroje. K tomu ovšem musela být definována od základu nová technika přenosu,

která však s sebou přinesla určité komplikace a nedostatky z hlediska

kompatibility. FC definuje a rozlišuje tři různé architektury: Point-to-Point,

Arbitrated Loop a Switched Fabric.

Každá z těchto topologií vykazuje určitá omezení specifická pro použitý

protokol, například u maximálního počtu podporovaných zařízení nebo při

nalogování. Navíc se liší jejich definice, kupříkladu FC-AL pro Arbitrated Loop

nebo FC-SW pro Switched Fabric. To vedlo a dosud může vést k problémům z

hlediska implementace a kompatibility. Velká část konfigurace, která je díky

tomu nezbytná, by měla být vyřešena na straně zařízení a switchů

prostřednictvím autokonfigurace potažmo implementace tzv. G-Portu (Generic

Port, nachází se na FC přepínačích, jeho funkce závisí na tom, k jakému portu

dalšího přepínače je připojen). S tím nicméně vyvstal nový problém, který je

znám už řadu let u Ethernetu 10/100/1000 a týká se Auto-Sensingu (automatické

zjišťování rychlosti připojení): Když obě strany provádějí Auto-Sensing, může

snadno dojít k nedorozumění, takže nakonec musejí být nakonfigurovány manuálně.



Finesy v detailech

Auto-Sensing působil problémy, jestliže se někdo odvážil učinit krok od Fibre

Channelu s přenosovou rychlostí 1 Gb/s (100 MB/s při poloduplexním, potažmo 200

MB/s v plně duplexním provozu) ke 2 Gb/s (200 MB/s poloduplexní nebo 400 MB/s

duplexní). Zařízení musí nejen rozlišovat, ve které FC architektuře má

operovat, nýbrž také jak rychlý přenos má zajišťovat. Vzhledem k tomu, že

neexistuje žádná předepsaná definice nebo standard pro Auto-Sensing u 1Gb/s

nebo 2Gb/s Fibre Channelu, potažmo jeho jednotlivé architektury

(Point-to-Point, Arbitrated Loop či Switched Fabric), je ponecháno na každém

dodavateli, jak jej implementuje, respektive jak obejde problémy s

nekompatibilitou.

Proto není překvapivé, že se už popsané problémy s kompatibilitou brzy vyústily

v další: v nekompatibilitu mezi přepínači různých výrobců. V oficiální

specifikaci FC-SW (Switched Fabric, architektura, která je už delší dobu

dominantní) je definován pouze tzv. E-Port (tj. port určený pro propojení

přepínačů). Definice dalších bodů (například výměny směrovacích informací či

jednotného směrovacího protokolu namísto protokolů různých výrobců, jako je

RIP-I, RIP-II, OSPF, abychom uvedli jen několik) chybějí, stejně jako standard

pro výměnu RSCN (Registered State Change Notification), tj. výměnu informací o

přihlášení respektive odhlášení zařízení, nebo pro výměnu a cachování SNS

(Simple Name Server, decentralizovaná registrace zařízení, obdobná DNS

informacím v IP sítích). V důsledku toho se ukázalo, že FC switche různých

výrobců nebyly vzájemně kompatibilní. Uživatelé, kteří chtěli implementovat FC,

se proto museli rozhodnout, na kterého z dodavatelů se budou spoléhat kdo má

největší šance na přežití na trhu a zároveň nabízí nejlepší ochranu investic?



Poškozený dojem

Teprve přednedávnem, když se začala o storage networking zajímat firma Cisco

(jakožto jeden z předních globálních hráčů na poli síťových zařízení) a

obrátila svoji pozornost na FC i na stále ještě ve fázi vývoje se nacházející

iSCSI, začalo se vše pomalu měnit. Dominantní prodejci FC switchů se ohledně

protokolů pro směrování, SNS, RSCN a dalších velmi rychle sjednotili. To

vyústilo v novou specifikaci „Switch Interoperability“, která je základem

standardu FC-SW2.

Bohužel není snadné napravit poškozenou reputaci, kterou si Fibre Channel do té

doby díky problémům s kompatibilitou získal. Stávající i potenciální uživatelé

si stále ještě spojují FC-SW, FC-SW2 a „Switch Interoperability“ s domněnkou,

že Fibre Channel nezaručuje kompatibilitu a že pro něj žádný jednotný standard

neexistuje. Těmto předsudkům musejí zástupci FC tábora čelit pouze

vysvětlováním a demonstrováním kompatibility.

Nedávno se Fibre Channel Community rozhodla vložit mezi současné standardy pro

přenosové rychlosti 1 Gb/s, 2 Gb/s a příští standard pro 10 Gb/s mezistupeň s

propustností 4 Gb/s. Důvod pro to lze hledat v neposlední řadě i v rostoucím

tlaku, jemuž je Fibre Channel vystaven ze strany IP storage, která na sebe

poslední dobou strhává pozornost. Takto mají dodavatelé na trhu SAN díky

přenosové kapacitě 400 MB/s (poloduplexní přenos), respektive 800 MB/s (plný

duplex), opět argument, proč se i nadále soustředit především na Fibre Channel.



ISCSI nastupuje

Standard iSCSI vlastně představuje spojení dvou veteránů IT odvětví: Ethernet

oslavil přednedávnem 30. výročí a SCSI je na trhu vlastně už od roku 1979

(tehdy bylo ještě označováno SASI). To je ale vše, co mají obě technologie

společného. Ethernet byl dosud používán výhradně pro zařízení založená na File

I/O přenosu (tzn. tj. pro vstupně/výstupní přenos souborových dat), zatímco

SCSI pro Block I/O (tzn. přenos logických bloků z datového úložiště) což v

podstatě představuje dva protichůdné průmyslové standardy. Při transportu z

SCSI přes TCP/IP vzniká synergie. Aplikace, pro které byl dosud vyhrazen pouze

Fibre Channel, je dnes takto možné realizovat pomocí jiné technologie ať už jde

o vybudování storage sítě nebo propojení blokově založených ukládacích systémů

na větší vzdálenosti (což se týká oblastí jako remote mirroring nebo vzdálené

zálohování).

To přináší vyšší flexibilitu, při níž je možné volit mezi oběma technologiemi

podle různých požadavků s ohledem na minimální náklady, malé zatížení

serverových CPU nebo také typ propojení. Přitom jsou pro iSCSI k dispozici,

stejně jako v případě druhé techniky, různé možnosti nasazení: bridge a routery

(podobné těm, které byly vyvinuty pro SCSI/Fibre Channel), appliance (jako

např. Intransa či Elipsan) a nativní implementace (jako Network Appliance

Filer).



Běžná infrastruktura

Pro transport dat je v případě iSCSI využíván standard Ethernet (a TCP/IP),

díky čemuž může být snadno využita existující síťová infrastruktura nebo

internet. ISCSI přenos je všemi síťovými přepínači a routery zpracováván stejně

jako TCP/IP pakety. Dokonce ani switche pro 2. či 3. vrstvu nemohou rozpoznat,

zda přes TCP/IP přenášejí NFS, HTTP nebo iSCSI data.

Zda je pro implementaci iSCSI smysluplné sdílet infrastrukturu nebo vybudovat

novou síť nelze obecně říci. Zde by mělo být rozhodováno na základě dostupné

šířky pásma přepínačů a infrastruktury jako takové.

Je zřejmé, že pokud by měly být provedeny inovace a změny ve všech vrstvách,

neobejde se vše bez rozsáhlého zaškolování a důrazu na kompatibilitu při

nákupu. SAN založené na iSCSI nabízejí výhodu z hlediska nákladů, neboť firmy,

jejichž IT zaměstnanci už mají zkušenosti s Ethernetem a TCP/IP, mohou jejich

znalosti využít i v případě iSCSI. Přesto však bude nasazení iSCSI řešení

vyžadovat dodatečné školení protože ale čtyři z pěti vrstev spočívají na

principech, které odpovídají už existujícím vědomostem, lze náklady na

proškolení udržet v rozumných mezích. Také v případě hledání chyb se lze vrátit

k dosavadním znalostem a zkušenostem se sítěmi.



Problematická bezpečnost

Teoreticky může být iSCSI nasazeno i v sítích založených na ethernetovém

standardu 10Base-T (10 Mb/s), ty jsou však v praxi při maximální propustnosti 1

MB/s se synchronním přístupem k paměti většinou pomalé. Proto se vychází z

toho, že bude iSCSI obvykle implementováno na bázi Gigabit Ethernetu. V

některých prostředích je smysluplné využívat také standard Fast Ethernet

(100Base-T, 100 Mb/s, tj. přibližně 10 MB/s). Nižší přenosové rychlosti najdou

využití jen stěží. Výjimky se však možná vyskytnou v oblasti metropolitních

sítí, MAN (Metropolitan Area Network), potažmo WAN (Wide Area Network), neboť

při takovém uplatnění je obvykle používán asynchronní přenos, a aplikace tak

nejsou příliš závislé na latenci síťového připojení.

Často je v diskusích o iSCSI uváděn argument týkající se nedostatečného

zabezpečení. Aktuální implementace iSCSI v současnosti ještě nezahrnují

možnosti šifrování dat (jako IPSec), což má důvody zejména ve výkonových

omezeních. V případě FC však šifrování dat také dodnes není ze stejného důvodu

k dispozici. Dokud nebudou související vývojové práce dokončeny, mohou

uživatelé využívat IP šifrování mezi jednotlivými lokalitami TCP/IP sítě. Pro

tyto účely už existují potřebná zařízení a standardy.



FC versus iSCSI

Od roku 1999 s tím, jak začaly práce na definici iSCSI, se rozhořely vášnivé

diskuse o tom, zda by iSCSI mohlo vystřídat Fibre Channel. Přitom ale bylo

často přehlíženo, že Fibre Channel a iSCSI mají oslovit rozdílné cílové

skupiny. Firmy, které disponují potřebnými finančními prostředky a

infrastrukturou, už Fibre Channel využívají, nebo tak plánují učinit v blízké

budoucnosti. Jiné pak budou především na základě výhod z hlediska nákladů

investovat právě do iSCSI.

Další výhodou iSCSI je, že potenciální uživatelé mohou takové SAN systémy

jednoduše testovat v rámci stávající LAN. Většina dodavatelů operačních

systémů, například distributoři Linuxu, Hewlett-Packard nebo i Microsoft, už

podporu iSCSI dala bezplatně k dispozici nebo ji přinejmenším ohlásila.

Jak iSCSI, tak Fibre Channel budou pro přenos v další fázi využívat 10Gb/s

fyzickou platformu. Už dnes existují komponenty pro 10gigabit Ethernet, zatím

však nejsou finančně dostupné pro každou firmu. Při cenách 10–20 tisíc eur na

port je klientela stále dosti omezená. Lze ale vycházet z toho, že s postupnou

akceptací těchto zařízení na trhu začnou ceny postupně padat. Zvýšení objemu

produkce následně způsobí pokles výrobních nákladů, a tím opět i cen.

Ovšem například podle předpovědi společnosti Linley Group by měly prodeje FC

zařízení v nejbližších letech růst a sítě SAN založené na IP by měly převzít

žezlo (a stát se dominantní nebo přinejmenším nejrychleji rostoucí

architekturou) v roce 2007, přičemž právě iSCSI je pro FC největším konkurentem.

Tento proces bude doprovázet i pokles cen FC komponent až na polovinu či méně

oproti současné úrovni (opět predikce pro rok 2007). Špičky by přitom prodeje

měly dosáhnout v následujících dvou letech (s 20% růstem příjmů, v roce 2006 už

to bude porostou pouze o 10 %). To lze vysvětlit tak, že přijetí IP SAN nebude

příliš rychlé jak kvůli konzervativnímu přístupu IT trhu, tak díky pozici,

kterou si Fibre Channel získal a z níž bude ještě nějakou dobu těžit s ohledem

na snahu uživatelů o návratnost investic.



Architektury Fibre Channel

Point-to-Point (bod-bod): V rámci této architektury jsou přímo propojena 2

zařízení. Ta mají k dispozici plně duplexní spojení s celou šířkou pásma.

Arbitrated Loop (řízená smyčka): Bez potřeby FC přepínače lze do jediného

řetězce (smyčky) propojit až 126 FC zařízení. Uzel, který chce předávat data,

zažádá o řízení smyčky a poté zformuje bodové spojení k cílovému uzlu. Všechna

zařízení mezi nimi přitom přenášená data přeposílají. Přenosová linka je

sdílená a navíc vzniká zpoždění při předávání mezi uzly, v praxi se proto AL

používá pro maximálně 30 propojených zařízení.

Switched Fabric (přepínaná křížová struktura): Tato architektura využívá jeden

nebo více FC přepínačů, k jejichž portům se připojují storage uzly. Tak může

více zařízení komunikovat současně a přenosové médium není sdílené (neblokující

architektura). Při 24bitové adresaci je možné propojit maximálně 239 switchů,

které disponují 8–64 porty pro samotné uzly. Takto lze dosáhnout vysokého

výkonu i škálovatelnosti.