Jak na audio a video...

1. 5. 2004

Sdílet

Potemnělou místnost ozařuje tmavě šedá obrazovka monitoru. Náhle se zreproduktorů podél stěn ozývá ryčná hudba, a na obrazovce se pohybuje typické logo Twentieth Century Fox. Po tomto...

Potemnělou místnost ozařuje tmavě šedá obrazovka monitoru. Náhle se z
reproduktorů podél stěn ozývá ryčná hudba, a na obrazovce se pohybuje typické

logo Twentieth Century Fox. Po tomto úvodu už začíná to, na co jsme se těšili

nejvíce. Film. Aby však počítač vůbec hrál, potřebujeme kromě CD, na němž je

film uložen, a přehrávače, mnoho menších pomocníků, které sice nevidíme, ale

bez nichž by to nešlo. K nejdůležitějším patří kodeky, starající se o obraz a

zvuk.



Videokodeky – situace stále nepřehledná



Existuje poměrně slušné množství kodeků videa. Některé jsou lepší, jiné horší.

Ne všechny se hodí na vše, a některé umí také pěkně potrápit. Nyní se na

některé z nich podíváme. Jaký kodek si vybrat? Jaké jsou možnosti a výkon

různých kodeků? Pokud vás zajímají odpovědi na tyto otázky, čtěte dál.



Jak a proč kódovat video

Multimediální data, tedy především obraz a zvuk, mají mezi ostatními typy

počítačových dat několik zajímavých zvláštností. Tou první z nich je, že

potřebují poměrně velké množství prostoru pro uložení. Dále je třeba při jejich

pořizování i reprodukci zajistit určitý minimální tok informace k tomu, aby

výsledný dojem, tedy obraz a zvuk, byl přirozený. To jsou požadavky vskutku

nemalé.

Vedle toho se ale multimediální data odlišují například od textových dokumentů

a aplikací ještě v něčem jiném. Jestliže je třeba je komprimovat, nemusí být

jejich dekomprese naprosto přesná. Zatímco změna libovolné hodnoty uvnitř

aplikace by způsobila její nefunkčnost, nebo přinejmenším nestabilitu a velkou

poruchovost, v případě videa změna způsobená komprimací a následnou

dekomprimací nevadí. Nepracuje se totiž s naprosto precizními daty

znamenajícími instrukce, ale s obrazem, který je ve výsledku analogový a jeho

příjemcem není počítač, ale snadno oklamatelné lidské smysly, v případě videa

zrak.

Kombinací obou předchozích tezí vzniklo ztrátové kódování videa. Využití

oklamání smyslů umožňuje zmenšit obrovskou masu obrazových videodat na

smysluplné minimum, které se vejde na současné datové nosiče, tedy především na

CD disky a na DVD, a je ho možné distribuovat s využitím internetu.

Cenou za drastické snížení objemu dat je kromě dopadu na kvalitu

reprodukovaného také náročnost této dekomprese. Především se jedná o náročnost

na početní výkon zařízení, které dekompresi provádí, a pak také na rychlost

jeho paměti a schopnosti číst a vyměňovat si informace v rámci jednotlivých

částí. Posledním podstatným kritériem zde je míra snížení kvality, tedy nakolik

se dekódovaný obraz odlišuje od původního a zda je možné toto snížení

zaregistrovat. Zde je však třeba vzít v úvahu relativní faktor, kterým je

subjektivní rozdílnost. Díky tomu, že video se přehrává na různých zařízeních a

různých výstupních systémech (CRT obrazovka, LCD displej, plátno a

dataprojektor) a díky tomu, že různí jedinci vnímají obraz různým způsobem,

představuje i jeho změna pro ně různé hodnoty. To je faktor, který se velice

obtížně kvantifikuje, a právě proto jej označujeme za subjektivní. Faktem však

je, že tento subjektivní faktor představuje podstatnou část zhodnocení obrazu,

přesněji řečeno multimediálních dat jako takových.



Kodek?

Pod pojmem kodek videa označujeme algoritmus, který se stará o kompresi a

dekompresi obrazu. V podstatě tedy o jeho převedení z nekomprimovaného formátu

do minimalistické velikosti a následnou rekonstrukci a zobrazení. Tento

algoritmus může být integrován do různých hardwarových zařízení, nebo se může

nacházet jako standardní či doplňková část operačního systému, případně jako

samostatný produkt. Jestliže v minulosti byly obrazové kodeky integrovány do

přehrávačů multimédií, v současné době tomu tak není. Například populární

Windows Media Player je prakticky vzato pouze jakýmsi frontendem, tedy

rozhraním, jež zobrazuje multimédia a komunikuje s uživatelem. Skutečnou práci,

tedy dekompresi, obstarávají kodeky, které jsou integrovány do operačního

systému a s přehrávačem nemusejí nijak souviset. To eliminuje výběr

multimediálních přehrávačů využívajících tuto koncepci prakticky pouze podle

toho, který se lépe ovládá a lépe vypadá, který má více doplňkových funkcí.

Jejich jádro, tedy sada kodeků, je ve všech případech totožné.



Kodek si nevybereš

Typický uživatel počítače přichází do kontaktu s hotovými videosoubory. Má je

na kompaktních discích, stahuje tyto soubory z internetu. Když pomineme

problematické stránky jejich využívání, například to, že v naprosté většině se

jedná soubory s právními vadami (nelegální kopie), budeme potřebovat k přehrání

souborů, s nimiž se můžeme potkat, pestrou škálu různých kodeků. Aby je tedy

bylo možné přehrávat, je nezbytné mít tyto kodeky připraveny v počítači a v

aktivním stavu, tedy v takovém, ve kterém je přehrávač médií, ať už WMP nebo

jiný, schopen je zavolat a využít.

K přehrávaní například stažených filmů potřebujeme typicky kodeky dva. Jeden z

nich je určen pro video, druhý pro zvukovou stopu. Ačkoliv jsou obě části filmu

uloženy v jediném souboru, prakticky představují dva různé druhy dat, které

jsou synchronizovány. Obrazový kodek se stará pouze o dekódování videa, zvukový

pak s nim spolupracuje a zajišťuje doprovod. Poslední komponentou přehrávání

filmů pak bývá technologie určená k tomu, aby s výsledným audiovizuálním dojmem

propojila třetí textovou informaci. Jinými slovy systém zobrazující titulky.

Souhra těchto komponent vede k výslednému dojmu tedy k přehrávání filmu.

Jakmile již soubor s filmem máme, obrazové a zvukové informace v něm obsažené

jsou zakódované a synchronizované. Bylo čistě na libovůli autora tohoto

souboru, tedy člověka který jej kódoval, který konkrétní algoritmus, přesněji

řečeno kterou kombinaci algoritmů pro svou práci využil, a jediné, co může

typický uživatel dělat, je se tomuto stavu přizpůsobit. Převod hotového souboru

z jednoho formátu do jiného za použití konverzního systému založeného na dvou

kodecích vstupním a výstupním, je sice možné, ale problematické řešení, i když

v některých případech použitelné, například když je potřeba přehrávat na

slabším hardwaru film zpracovaný náročným kodekem. Tak se dá říct, že pokud již

film máme, jeho kodek si příliš nevybereme. Pokud chceme sami audiovizuální

soubor vytvořit, je situace samozřejmě odlišná.



Nejčastěji používané kodeky

V současnosti používané kodeky jsou obvykle založeny na obecném algoritmu

MPEG-4. Tento algoritmus je velmi výkonný a vyskytuje se v různých variantách.

Jeho prvotním využitím byly dlouho připravované a testované kodeky WMV (Windows

Media Video) společnosti Microsoft. Poté, co ale došlo k roztržce mezi touto

společností a částí komunity, která se na kodeku podílela, vznikl jeho hack,

dnes známý jako DivX ;-). Postupem času a po mnoha změnách vznikla společnost,

která tento kodek prodává. V důsledku komercionalizace bývalého hacku bylo

vytvořeno několik dalších kodeků, z nichž nejznámější a nejpoužívanější je XviD.

Dalším populárním kodekem je Apple Quicktime. Tento kodek vznikl původně pouze

pro počítače Macintosh, nicméně je běžně instalován i na PC s operačním

systémem rodiny Windows. Jedná se o komerční produkt, který je velice populární

zejména v USA. Quicktime je nejpoužívanějším kodekem pro kompresi například

filmových trailerů, ale i obecně neproudového videa, které stahujeme z webových

serverů.

Posledním ze zajímavých kodeků je Real Video společnosti Real Networks. Ačkoliv

je tento kodek univerzální, nejčastěji se s nim setkáme u streamovaného videa z

webových serverů, kde soupeří především s konkurencí od Microsoftu.



Parametry kodeku

Pokud se na kodek podíváme z typické, tedy uživatelské strany, funguje v

podstatě takto. V první fázi je obsah souboru se záznamem rozebrán a rozdělen

na obrazovou a zvukovou část. Tyto části jsou pak předávány jednotlivým

kodekům. Obrazový kodek obvykle funguje na principu jednotlivých obrázků. Ty

jsou komprimovány triviálním algoritmem a rychle se střídají, což vytváří iluzi

pohyblivého obrazu. Aby se snížilo množství dat, které je při tom potřeba

přenést, nejsou v souboru s videem uloženy všechny obrázky. V některých

případech totiž stačí, aby byl ve scéně „kompletní“ pouze obrázek jeden.

Ostatní pak již jen obsahují rozdíl mezi tímto původním obrázkem a sebou. Tedy

to, co se pohnulo, nebo změnilo barvu. Tak je možné dosáhnout vysokého stupně

komprese.

Z předchozího vyplývají dva podstatné parametry komprimovaného videa. Prvním z

nich je velikost komprimovaného souboru, druhým pak datový tok, který je nutný

pro korektní čtení a prezentaci souboru. Ideálem je, aby obě tyto hodnoty byly

pokud možno co nejmenší, a to při co nejmenší ztrátě kvality způsobené kompresí.

Všechny tyto parametry jsou jak absolutní, tak relativní. V případě současných,

velmi výkonných osobních počítačů jsou hodnoty požadované videokodeky relativně

malé, avšak jinak tomu je u speciálních zařízení, jako jsou kapesní přehrávače,

hardwarové dekodéry a další podobná zařízení.

Uživatelsky podstatným parametrem videa je rozlišení, ve kterém se nachází. Pro

delší záznamy, tedy obvykle pro celovečerní filmy a podobné útvary, se obvykle

využívá rozlišení DVD Pal. To činí 720 × 576 obrazových bodů. Pro potřeby

některých zařízení, především velkých počítačových monitorů, je toto rozlišení

přehrávači softwarově interpolováno na větší míru při zachování poměru stran.

To ovšem vytváří dodatečné hardwarové nároky, zvětšuje se totiž finální, tedy

již dekódovaný obraz a při plné frekvenci, nikoliv skládané částečné obrázky.

Problémem, který je typický pro „ne původní“ kodeky a který způsobuje jejich

obtížnou implementaci především pro „ne-PC“ zařízení, je změť verzí. Obrazové a

také zvukové kodeky (MP3, OGG, AC3 a další) existují v různých verzích, jež

jsou ne vždy vzájemně kompatibilní. V důsledku toho musí zařízení pro

přehrávání obsahovat podporu co možná největšího množství jednotlivých verzí,

aby bylo možno zajistit jejich fungování. V případě klasického počítače se pak

setkáváme se stejným problémem, je totiž nutné mít různé verze různých kodeků.

Proto existují balíčky, které obsahují v jediném instalátoru množství různých

verzí různých kodeků, a dávají tak možnost dobrého fungování prakticky

jakéhokoliv videa. Je však třeba poznamenat, že tyto balíčky mívají v některých

případech problémy s autorskými právy nebo s fungováním na některých systémech,

ale to zde není hlavním předmětem.



Vyrábíme video

K vytvoření videosouboru potřebujeme jednu ze dvou věcí. Buďto zdrojový soubor,

který převedeme na požadovaný kodek a počítač, nebo přístroj, který to umí

udělat za nás. Mezi tyto přístroje patří digitální videokamery a několik

dalších. V případě zdrojových souborů se obvykle jedná o formát hrubých dat

(RAW), jednoduchou bezeztrátovou kompresi (Indeo), nebo o zálohování jiného

druhu média (DVD,VHS), DVD je v současné době nejčastější. Video se kóduje

prostřednictvím samotného kodeku a patřičné aplikace. Ty existují ke každému

kodeku, v případě DivXu jsou součástí standardního balení, například u

Quicktime si je musíme zakoupit (a tedy zaplatit). V současné době je kódování

poměrně rychlé, v době pomalejších počítačů trvalo velice dlouho, anebo stejně

jako přehrávání ztrátového videa vyžadovalo nejmodernější výbavu, nebo dokonce

specializovaný hardware. Popis jednotlivých aspektů této činnosti by vyžadoval

mnohem větší rozsah a je předmětem specializovaných časopisů a publikací, to,

co nás zajímá, je především přehrávání videa.



Jak si vybrat?

V podstatě všechny kodeky, o kterých zde dnes hovoříme, splňují základní

požadavky na práci s krátkým i s dlouhým videem. U mnohých existují varianty

pro rychlé a pomalé video, pro různá rozlišení a bitraty. Pokud chceme pouze

přijímat (sledovat) soubor, který existuje v několika verzích, je dobré si

vybírat především podle hardwarových a softwarových možností, jež máme k

dispozici. V tom případě se na prvním místě nachází DivX, následován XviD a

WMV. Další kodeky se pak řadí za ně, ačkoliv žádný již dnes neobsahuje hrubé

chyby, které byly typické pro rané verze např. Intel Indea, původních kodeků

Microsoftu nebo Cinepaku. Při vytváření videa naopak vycházíme z požadavků

předpokládaných příjemců, tedy diváků. Pro kvalitní práci se hodí Quicktime pro

streamování Realvideo či ASF, profesionální je Windows Media Video. Většinou

je, zejména při distribuci finálního souboru prostřednictvím internetu, vhodné

použít standardní DivX nebo XviD. V každém případě, jak již bylo uvedeno výše,

je vhodné počítat také s uživateli, jež jsou méně hardwarově vybaveni, a

použití, například XviDu při vysokém rozlišení a s nadstandardním frameratem,

by jim mohlo dělat potíže.



Slovníček videa



Komprimovaná velikost – Množství dat, které potřebujeme pro uložení

komprimovaného videa. Moderní kodeky jsou stavěny tak, aby bylo možné na jedno

klasické CD uložit hodinu až devadesát minut standardního videa.

Framerate – Počet snímků za sekundu. Pro plynulé video je třeba dosáhnout

alespoň 25, vyšší hodnota znamená plynulejší video, ale potenciální problémy s

přehráváním.

Kodek – Aplikovaný kódovací/dekódovací algoritmus

MPEG – Moving Picture Experts Group, označení standardu, ale také jeho

původních vývojářů. Vznikl z M-JPEGu, „pohyblivé“ verze nejrozšířenějšího

formátu ztrátové komprese stacionárního obrazu (fotografií).



Zajímavé odkazy



•http://www.extremetech.com/prin­t_article/0,1583,a=121163,00­.asp – srovnání

různých kodeků

•http://www.vqeg.org – skupina zabývající se kvalitou videa

•http://www.tvfreak.cz/in­dex.php?sekce=video&clanek=m4tes­t&strana=1 – jiné

srovnání kodeků

•http://www.kodeky.cz – rozcestník na různé verze kodeků

•http://www.divx.com – kodek DivX

•http://www.xvid.org – kodek XviD

•http://www.windowsmadia.com – kodeky systému Windows Media

•http://www.quicktime.com – kodek Apple Quicktime

•http://www.codecpack.com – odtud si můžete stáhnout kodeky v balíčku „All in 1“



Nejrozšířenější videokodeky



• WMV Windows Media Video (FMV, ASF -) kodeky společnosti Microsoft. Kvalitní a

rychlé, obsahují digitální ochranu autorských práv (DRM). V aktuální verzi 9 se

hodí především pro profesionální využití, například na internetu se s nimi

setkáme jen poměrně málo.

• DivX – Kodek, který původně vzniknul jako hack WMV a využíval jeho ovladače v

kombinaci s MP3 pro kódování zvuku. V současné době je ale DivX komerční

produkt a představuje jakýsi základ alternativních kodeků. Jeho rozšířenost je

značná, avšak rozšířenost konkurence také stoupá a původnímu DivX tak

konkurenti výrazně dýchají na záda.

• XviD – Tento kodek vychází z původních snah DivX ;-) o otevření videa ve

standardu MPEG-4. Je vyvíjen (důsledně pouze obrazová část) jako projekt s

otevřeným zdrojovým kódem. Lze sehnat kompilace pro různé systémy. Nabízí

srovnatelnou kvalitu, je však náročnější na hardware. Jeho otevřenost a

současná i budoucí absence jakéhokoliv DRM jej řadí do popředí zájmu.

• Apple Quicktime – Jeden z prvních kodeků videa, jež začaly být komerčně

využívány, dnes existuje v aktuální verzi 6.5. V našem prostředí není příliš

využíván a nesetkáme se s ním příliš často ani ve výměnných systémech. Původně

pochází z počítačů Macintosh, existuje i pro Windows. Nejčastější využití je

pro video umístěné na webových serverech, především amerických. Kodek i

přehrávač Quicktime jsou náročné na hardwarové prostředky, kvalita je poměrně

dobrá. Používá buďto MPEG-4, nebo kodek společnosti Sorenson.

• Real Video – Tento kodek je produktem společnosti RealNetworks. Používá se

nejčastěji pro přenos proudového videa (streamování) a tvoří tak starší

konkurenci formátu ASF (Aktive Streaming File) od Microsoftu. Může být

samozřejmě použit pro off-line video, tedy pro záznamy v souborech, není však v

tomto ohledu zejména v případě rozsáhlejších záznamů v našem prostředí v

domácnostech příliš využíván.



Kodeky, které se vymkly z rukou



Současní „tahouni“ v oblasti kodeků DivX a XviD vznikly (původně DivX ;-) ) v

důsledku snahy Microsoftu dosáhnout velmi silné konkurenční pozice v oblasti

kódování videa, která se prolnula se snahou vzniklý formát maximálně

zabezpečit. Následovalo prolomení jeho ochrany, došlo k veřejnému uvolnění a

následnému vytváření konkurenčních kodeků, které v důsledku velice kvalitní

formát využitelný pro komerční distribuci videa degradovalo jako proprietární,

uzavřený a nepřehledný. Kodeky, zejména po vzniku XviDu, jenž je nejen

otevřený, ale také velmi dobře respektuje standard MPEG-4, se zcela vymkly

kontrole a umožnily stav, jehož jsme dnes svědky. Tedy že internetem se nešíří

jen záplava digitální hudby, ale také nejnovějších filmů převážně hollywoodské

provenience, především ale výměnnými systémy. Tento paradoxní stav, jenž vedl k

velkému rozhořčení filmového průmyslu, nejen že přetrvává, ale vůbec nijak se i

přes snahu s ním něco dělat nemění. S trochou nadsázky by se dalo říct, že

hamižnost vedla k otevření toho, co mělo být uzavřeno. Dnešní kodeky jsou od

vykradeného původního algoritmu již velmi vzdáleny a vyvíjejí se vlastním

životem. Ke spokojenosti tvůrců souborů i uživatelů diváků.



Srovnání nejznámějších videokodeků



WMV (Windows Media Video)

http://www.windowsmedia.com

Windows Media poskytuje kvalitní video při relativně malém datovém toku, ale

kódovat s ním celovečerní film není nejlepším nápadem. Je ideálním formátem pro

kratší záznamy nebo pro takové, které se budou streamovat (ASF). Obvykle nemá

žádné problémy s přehráváním na systémech Windows, jinde je situace o něco

problematičtější. Obsažené DRM umožňuje řídit možnost používání souboru a

nejjednodušší cestou k jeho vytvoření je Windows Movie Maker, jinak standardní

součást Windows XP.



DivX

http.//www.divx.com

Aktuální verze kodeku DivX přináší solidní kvalitu videa 5.1.1 a představuje

určitý standard kvality. DivX zachovává velmi dobrý obraz jak u pomalého videa,

tak i u scén, kde dochází k velkému pohybu mnoha objektů (což je asi

nejproblematičtější situace). Předchozím verzím bylo občas vyčítáno, že ne vždy

jsou schopny udržet požadovaný bitrate, přičemž mohlo docházet k zadrhávání

obrazu. Tento problém je však již minimalizován. Nedostatkem DivXu je

skutečnost, že základní bezplatná verze „pro“ modelu kodeku obsahuje reklamu,

vyšší verze jsou drahé a verze bez reklam toho moc neumí. Pro přehrávání videa

je však DivX ideální mimo jiné proto, že není příliš náročný a je kvalitativně

srovnatelný s WMV. Filmy v něm jsou masivně rozšířeny na internetu, čemuž

nevadí ani skutečnost, že v některých případech na některých typech hardwaru

dochází k potížím při synchronizaci obrazu a zvuku.



XviD

http://www.xvid.org

Otevřený kodek, často používaný v kombinaci s MP3 a AC3 zvukovým kódováním.

Svou kvalitou je na pomezí mezi WMV a DivX. Existuje několik rozšířených

kompilací, což může být problematické. Hlavním technickým problémem je

hardwarová náročnost. Obraz je sice kvalitní, leč při použití některých z

těchto kompilací dochází zejména na OS Windows k občasnému rozpadávání obrazu i

u v každém případě nepoškozených souborů. Dalším problémem mohou být

stacionární scény. Celkově se počet filmů v tomto kodeku, na které můžeme

narazit na internetu, pozvolna zvětšuje a s XviD je třeba do budoucna, zejména

pro jeho otevřenost počítat. Při kódování videa vychází XviD jako mírný vítěz v

případě, že si nechcete zaplatit za DivX ani použít Windows Media. Hodí se pro

kódování celovečerních filmů i kratších záznamů, ačkoliv pro to první je

vhodnější.



Quicktime

http://www.quicktime.com

Aktuální Quicktime, využívající MPEG-4 za třicet dolarů, míří zřejmě ze všeho

nejvíce na monitory zámořských profesionálních uživatelů. Nabízí vynikající

kvalitu při vysokých hardwarových nárocích a vyšší ceně. Na celovečerní film v

tomto formátu narazíte jen zřídka. Verze pro Windows má problémy se stabilitou

a na XP v některých případech přestává reagovat. Stejně problematické je QT na

starších verzích tohoto operačního systému, zejména pokud běží na pomalejším

hardwaru. Výhodou QT je kouzlo nechtěného. Tento formát je podporován některými

digitálními fotoaparáty a kamerami, které jsou k nim dováženy. Díky tomu může

dojít k jeho vyššímu rozšíření, avšak úrovně DivX nebo třeba i WMV u nás asi

jen tak nedosáhne. Je to systém který zejména z tvůrčího hlediska našince

příliš nenadchne.



Real Video

http://www.real.com

Real Video je ideální pro streamovaní, nebo pro lokální obrazové soubory spíše

o nižší stopáži. Je také kvalitní a relativně nenáročné na hardware, široce

podporované. Stejně jako QT můžeme i tento formát najít v některých

hardwarových zařízeních, ta jsou však v našich podmínkách o něco vzácnější.

Problémem u delších záznamů je, i s aktuální verzí, víceméně náhodné

zasekávání, které je tím častější, čím vyšší rozlišení používáme. Kompresní

poměr je dobrý, avšak pro uložení celovečerního filmu v DVD rozlišení se

nehodí. Velkou výhodou je integrace zvukového kodeku a bezchybná synchronizace

obrazu a zvuku, stejně tak jako podpora napříč různými platformami (i

mobilními) a operačními systémy. Na tomto místě je třeba podotknout, že právě

na mobilních platformách je Real Video černým koněm.

Vojtěch Bednář



Audiokodeky – hudební revoluce nekončí



V jakých formátech je možné ukládat hudební soubory, a jaké mají audiokodeky

výhody a nevýhody?

Obrovský boom hudby na internetu, který odstartoval před nějakými deseti lety

příchod formátu MP3, ještě zdaleka není u konce. A ti, co se domnívali, že

formát MP3 je nedostižný a nemůže být překonán, se pěkně přepočítali. Postupem

času se na světě objevila řada nových formátů pro ukládání audiozáznamu a část

jich zase během krátké doby zmizela. Tak situace vykrystalizovala do dnešní

podoby, kdy je k dispozici několik velmi kvalitních a rozšířených formátů, a to

jak pro ztrátovou, tak pro bezeztrátovou kompresi. Pojďme se tedy nyní v

krátkosti podívat na to, v jakých formátech je možné ukládat hudební soubory, a

jaké mají rozličné kodeky výhody a nevýhody.

Komprimované audioformáty lze v zásadě rozdělit na dvě velké skupiny

bezeztrátové a ztrátové.

U prvně jmenovaných jsou zachovány v komprimovaném souboru veškeré informace

obsažené v originální nahrávce a po zpětném procesu jsou oba soubory naprosto

identické, sem patří například soubory s koncovkou APE (formát Monkey\s Audio).

Výhodou je právě 100% shoda s originálem (po zvukové stránce) a rychlost

komprimace a dekomprimace, nevýhodou relativně velká velikost v porovnání s

původním souborem ve formátu WAV (přibližně polovina).

U ztrátových se používají speciální algoritmy, které z původního souboru

odstraní všechny zvuky, o kterých si myslí, že je posluchač nemůže slyšet.

Nevýhodou je, že takto upravené soubory nemají zvuk 100% shodný s originálem a

relativně pomalý proces převádění do komprimovaného formátu, jasnou výhodou pak

je malá velikost takových souborů v poměru k originálnímu WAVu.

Jedno z nebezpečí ukrytých ve ztrátových formátech spočívá ve ztrátě určité

části originálních hudebních dat. Je to podobné typickému problému audiokazet.

Pokud si uložíte CD například do formátu MP3 a pak si ty samé soubory vypálíte

jako audio CD, jež si do MP3 uloží váš kamarád, a podobný proces proběhne ještě

několikrát, budete mít na konci skladby s podstatně horší kvalitou než původní

zdroj. Při každé kompresi do ztrátového formátu totiž kodek odstraní další část

hudebních dat. Podobně je tomu právě u audiokazet, kdy několikátá kopie se již

originálu podobá pouze vzdáleně.

Další nepříjemnost nastane, pokud si originální skladbu uložíte v příliš nízkém

bitratu (datovém toku). Máte sice malý soubor, která je relativně

poslouchatelný v přenosném MP3 přehrávači či běžných počítačových

reproduktorech, ale s kvalitní aparaturou či sluchátky vás kvalita poslechu

doslova otráví.

Toho všeho i dalších nástrah vás zbaví právě bezeztrátová komprese. Její

nevýhodou je ovšem zcela jednoznačně velikost komprimovaných souborů běžně se

pohybuje mezi 50–60 % velikosti původního WAVu. To je v porovnání například s

formátem MP3 několikanásobně více (přesný poměr závisí od použitého datového

toku).

Na straně bezeztrátových formátů je tedy naprostá zvuková shoda s originálem,

ztrátové formáty pro změnu bodují kompresním poměrem a tím velikostí souborů.

Záleží tedy na každém, čemu dá přednost zda preferuje nekompromisní kvalitu i

za cenu sotva poloviční úspory prostoru (v porovnání s WAVy), či naopak možnost

uložit do stejného prostoru několikanásobně více skladeb i za cenu o málo nižší

poslechové kvality.



Srovnání nejznámějších audiokodeků



Bezeztrátová komprese



APE (Monkey\s Audio)

http://www.monkeysaudio.com

Monkey's audio je pravděpodobně nejpopulárnější formát využívající

bezeztrátovou kompresi. Kompresní poměr se v závislosti na typu hudby a

nastavené kvalitě kódování pohybuje mezi 50 % a 60 % velikosti originálního WAV

souboru. Tedy ve stejném rozmezí jako ostatní rozšířené bezeztrátové algoritmy,

ale ve většině případů vychází soubory s koncovkou APE nejlépe jak z hlediska

rychlosti převodu, tak velikosti výsledného souboru. Výhodou Monkey\s Audio je,

že disponuje vlastním front-endem, tedy grafickým rozhraním, kde je možné

pracovat se soubory či volit možnosti komprese. Největší slabinou je pak to, že

prozatím jediným podporovaným operačním systémem jsou Windows. Pro někoho může

být také nevýhodou, že APE soubory není možné streamovat přes internet.



FLAC (Free Lossless Audio Codec)

http://flac.sourceforge.net

FLAC je podle odborného serveru Hydrogenaudio.com spolu se soubory APE

nejpopulárnějším bezeztrátovým formátem. Protože je od počátku vyvíjen jako

otevřený, je k dispozici nejen pro Windows, ale např. i pro Mac OS X, Linux a

další. FLAC na rozdíl od jiných bezeztrátových formátů podporuje streamování po

internetu. Maximální dosahovaná komprese se blíží 4 : 1, běžně se ovšem

pohybuje kolem 2 : 1 tříminutová skladba tak bude zabírat kolem 30 MB. FLAC je

velmi podobný formátu Monkey\s Audio, z hlediska kompresního poměru a rychlosti

za ním lehce zaostává.



Wavpack

http://www.wavpack.com

Zajímavostí formátu Wavpack je unikátní hybridní mód, který stojí na půl cesty

mezi bezeztrátovou a ztrátovou kompresí. Mód ukládá originální skladbu do dvou

souborů relativně malého ztrátově komprimovaného a korekčního, který v

kombinaci s prvním souborem dodává plnohodnotnou bezeztrátově komprimovanou

skladbu.



Ztrátová komprese



AAC (MP4)

http://www.apple.com/mpeg4/aac

Advanced Audio Compression (AAC) vytvořila před lety společnost Dolby s cílem

jít v kvalitě a kompresi za možnosti formátu MP3. AAC je jedním (pravděpodobně

nejznámějším) ze subformátů vzniklých z MP4 a za svůj jej (s koncovkou m4a)

přijala například firma Apple, která jej používá ve svém hudebním on-line

obchodě iTunes a MP3 přehrávačích iPod. Novinkou je pak vylepšení verze HE-AAC,

která používá podobné triky jako technologie MP3pro ke zvýšení kvality při

nízkých datových tocích pod 100 Kb/s, k tomu je ovšem třeba speciální HE

dekodér. Další použití nalezl formát AAC pro záznam zvukové stopy u MPEG-2

videosouborů, tam Dolby směřovala i vylepšené verze s označením AC2 a AC3.



MP3 (Lame)

http://lame.sourceforge.net

Soubory s koncovkou MP3 (MPEG 1 Layer III) jsou bezesporu nejpopulárnějším

formátem pro ztrátovou kompresi hudebních skladeb. Kompresní poměr dosahuje při

klasickém datovém toku (128 Kb/s) přibližně 10 : 1. Pro tento formát se

doporučuje bitrate 128–192 Kb/s, při jiných datových tocích vykazují lepší

výsledky jiné formáty. Kvalita výsledného souboru je kromě zvoleného datového

toku ovlivněna volbou enkodéru, tedy programu, který za pomoci kompresních

algoritmů provádí vlastní převod. Za nejlepší je obecně považován Lame, který

je k dispozici zdarma, a na jehož vývoji pracuje řada dobrovolníků.



MP3pro

http://www.mp3prozone.com

Jedná se o rozšíření existujícího formátu MP3. Zvenku není na první pohled

patrný žádný rozdíl, oba mají koncovku MP3 a oba lze přehrávat v existujících

přehrávačích. MP3pro má mezi „normálními“ MP3 daty navíc údaje o vysokých

frekvencích, které MP3pro přehrávače využijí pro vylepšení výsledného zvuku a

MP3 přehrávače je ingorují. Tvůrce toho formátu Fraunhofer Institute uvádí, že

MP3pro je 2× kvalitnější než MP3 při stejném datovém toku, a že tedy 128Kb/s

MP3 soubor je stejně kvalitní jako 64Kb/s MP3pro.



MP4

http://www.audiocoding.com

Nástupce MP3 s označením MP4 je v podstatě kontejner obsahující řadu

subformátů, z nichž nejznámějším je AAC. Soubory s koncovkou m4a obsahují pouze

audioobsah, MP4 soubory obsahují obojí jak audio, tak videoobsah.



MPC

http://www.musepack-source.de

Formát Musepack (MPC, MPEGplus) vychází z MP2 a je nekorunovaným králem

ztrátové komprese. Musepack vyplňuje mezeru mezi ztrátovými formáty s nízkým

datovým tokem (MP3 či OGG) a bezeztrátovými formáty. Při datovém toku nad 192

Kb/s se MPC nikdo nevyrovná. Web je momentálně pozastaven.



OGG

http://www.xiph.org

Ogg Vorbis je všestranný ztrátový formát, a při datových tocích mezi 96–128

Kb/s by jen těžko hledal konkurenci z hlediska kvality i velikosti souborů. Je

to otevřený formát bez jakýchkoliv poplatků či patentů, na jehož vývoji pracuje

řada dobrovolníků. Podpora hardwarových přehrávačů je zatím minimální,

softwarové přehrávače s formátem pracují buď nativně (podpora přímo v

programu), nebo prostřednictvím externího plug-inu.



WMA

http://www.microsoft.com/windowsmedia

S formátem WMA přišel Microsoft jako s variantou k MP3 se shodnou kvalitou při

nižším datovém toku. Kvalitou i kompresním poměrem se WMA pohybuje na úrovni

MP3pro. Výhodou je, že s WMA umí pracovat většina hardwarových MP3 přehrávačů,

nevýhodou je pak velký důraz na ochranu autorských práv, což v řadě případů

vede k problémům při běžném (legálním) používání chráněných skladeb. Poslední

verzí, kterou Microsoft představil, je MWA v9, jež při komprimování skladby

přidala dvouprůchodové VBR a tři nové subformáty WMA Lossless, WMA Pro a WMA

Voice. WMA Lossless je bezeztrátová komprese, kdy komprimovaný soubor

představuje polovinu až třetinu velikosti původního WAVu. WMA Pro podporuje 5.1

a 7.1 kanálový zvuk a umožňuje ukládat audio v profesionálním rozlišení 24

bit/96 KHz. A konečně WMA Voice je speciálně určen pro hlas i hudbu s datovým

tokem pod 20 Kb/s tedy pro desítky minut dlouhé záznamy s malou velikostí

výsledného souboru.



Slovníček audia



Bit Rate – datový tok, určující kolik bitů bylo použito pro záznam, udává se v

Kb za vteřinu, čím vyšší je počet bitů, tím větší a tím kvalitnější je výsledný

soubor. Audiokvalitu nikdy nelze získat zpětně konverze souboru s 128 Kb/s na

soubor s datovým tokem 320 Kb/s povede k získaní souboru s kvalitou 128 Kb/s a

velikostí 320 Kb/s. Navíc při každém takovém převodu dojde k malé ztrátě

kvality způsobené kompresními algoritmy. Pokud tedy není k dispozici originální

zdroj (audio CD), je lepší ponechat soubory tak, jak jsou.

Constant Bit Rate (CBR)- stejný bitrate (datový tok) je použit pro celý soubor.

Variable Bit Rate (VBR)- MP3 soubory se skládají ze stovek malých částí framů,

při použití VBR rozhoduje enkodér pro každý frame, jaký datový tok použije pro

zachování maximální kvality. Bit Rate tak u jednoduchých pasáží klesá a u

složitých částí skladby naopak roste. Nevýhodou je, že díky proměnlivému

datovému toku není řada přehrávačů schopna určit skutečnou délku skladby a

ukazuje číslo až o několik minut či desítek minut rozdílné (na přehrávání to

ovšem nemá vliv). Stadardem pro enkodéry je ukládat do prvního framu skutečnou

délku skladby, ale ne každý to dělá. Zmatek řeší až ID3v2 tagy.

Average Bit Rate (ABR) – velmi podobné VBR, ovšem na rozdíl od VBR je při

velikost výsledného souboru odvozena od průměrného datového toku. Dochází tedy

pouze k variaci datového toku při zachování stejné velikosti souboru jako při

použití CBR.

Stereo – není třeba nic dodávat, dvoukanálový zvuk je široce používán a

odpovídá standardu pro audio CD

Mono – nahrávka se zvukem pouze v jednom kanálu.

Joint Stereo – Pokud vezmete zvuk z levého kanálu a porovnáte jej se zvukem z

pravého kanálu, zjistíte, že je zde řada podobností. Joint Stereo tak pro oba

kanály shodné části ukládá pouze jednou, a redukuje tak množství dat nutných

pro záznam.

Frekvence – určuje, jak často je snímám zvukový záznam. Audio CD formát pracuje

s hodnotou 44 100 Hz čili 44,1 KHz a s touto frekvencí jsou pak ukládány i

komprimované soubory. Není žádný důvod pro ripování CD na frekvenci vyšší než

zmíněných 44,1 KHz.

Psychoakustický model – Tento princip používaný u ztrátových formátů se snaží

pomocí řady technik a postupů oklamat lidské ucho tak, aby se domnívalo, že

slyší originální skladbu, i když je pravdou, že z ní je mnoho detailů a

frekvencí, pro lidský sluch nepostřehnutelných, vypuštěno.

FreeDB, CDDB – Jak FreeDB.org, tak i CDDB.com reprezentují obrovský on-line

katalog prakticky všech vydaných audio CD. Díky tomu stačí, pokud do mechaniky

počítače vložíte hudební CD a přehrávač dokáže prostřednictvím identifikátoru

unikátního pro každé vydané CD automaticky zjistit umělce, název CD a názvy

jednotlivých skladeb. A to platí i pro zkopírovaná audio CD, pokud je spolu s

hudebními stopami zkopírován i zmíněný identifikátor. Jestliže vaše CD není

identifikováno a máte po ruce originální booklet, můžete disk do databáze zadat

sami. Zpočátku existovala pouze databáze CDDB jako bezplatný projekt, kam

informace o discích ukládali dobrovolníci, ovšem poté, co ji koupila soukromá

společnost, byly bezplatné služby převedeny na komerční, a proto vznikla

alternativa v podobě FreeDB. Postupně tedy naprostá většina programů přechází z

používání CDDB na FreeDB.



Zajímavé odkazy



•http://www.hydrogenaudio.org zřejmě nejpopulárnější diskusní server,

zabývající se digitálními hudebními formáty

•http://mp3.cz oblíbený server, věnující se digitálním formátům v češtině

•http://mp3.box.sk anglicky psaný slovenský server, kde najdete vše o digitální

hudbě



Který audioformát je nejlepší?



•Monkeys Audio – pokud chcete mít vaše skladby v té nejlepší kvalitě

•MP3 – pro maximální kompatibilitu s nejrůznějšími hardwarovými i softwarovými

přehrávači a pro přenos mezi různými operačními systémy (128–192 Kb/s)

•WMA – pokud má váš přenosný MP3 přehrávač omezenou velikost paměti a přitom

nepodporuje jiné formáty (64–96 Kb/s)

•AAC – vlastníte-li flashový či harddiskový MP3 přehrávač s větší kapacitou a

podporou tohoto formátu (např. iPod) (96–160 Kb/s)

•MPC – jestliže chcete maximální kvalitu zvuku, avšak zároveň požadujete

ztrátovou kompresi (160–320 Kb/s)

•OGG – univerzální použití a vynikající poměr velikosti a kvality (80–160 Kb/s)

Kamil Pittner