Prostě Ouvertura: O empétrojkách a lidech

1. 11. 1999

Sdílet

Formát mp3 se narodil v roce 1991 jako třetí přírůstek do rodiny standardů prokompresi zvukového záznamu. Pupeční šňůru přestřihli zkušení porodníci z Fraunhofer Institut Integrie...

Formát mp3 se narodil v roce 1991 jako třetí přírůstek do rodiny standardů pro
kompresi zvukového záznamu. Pupeční šňůru přestřihli zkušení porodníci z

Fraunhofer Institut Integrierte Schaltungen a do rodného listu vepsali nevábně

znějící jméno MPEG layer 3, zkráceně mp3. Příjmení MPEG (Moving Pictures

Experts Group) zdědila po otci standardu pro kódování videozáznamu, jehož

zvukovou složku představuje; zatímco její křestní jméno říká, že se králi

digitálního videa narodila jako třetí a nejmladší dcera, a je tedy, jak se píše

v každé správné pohádce, ze všech potomků nejschopnější. Důvodem, proč

empétrojka přišla do multimediálního království počítačů, byla snaha zajistit

uživatelům kvalitní zvuk při co nejmenším objemu dat.

Principem, jak se z kilogramu zvukového záznamu podaří získat méně než sto

gramů záznamu v prakticky stejné kvalitě, je ztrátová komprese založená na

pečlivě shromážděných znalostech o vnímání zvuku lidských uchem. Jednoduše

řečeno, originální záznam je podroben kompresnímu algoritmu, v jehož průběhu

přijde o všechny složky, které lidské ucho za daných podmínek není schopno

postřehnout. Nejdůležitější částí algoritmu je metoda temporal masking

využívající vedle omezeného frekvenčního rozsahu ucha i další meze a

setrvačnost jeho vnímání, kdy ucho vedle hlasitého tónu jedné frekvence není

schopno odlišit slabší tón jiné blízké frekvence, a to dokonce ještě i určitou

dobu po odeznění silnějšího signálu. Jakého kompresního poměru dosáhnete,

záleží na tom, jak kvalitního výstupu se chcete dobrat. Ten bývá obvykle

charakterizován tzv. bitrate (datovým tokem), čili kolik bitů je obětováno na

jednu sekundu záznamu, šířkou pásma neboli rozpětí frekvencí, které se z

původního záznamu berou v úvahu, a počtem zvukových kanálů. Zatímco datový tok

ze zvukového CD bývá 1 400 Kb/s, po převedení do mp3 se téměř stejného výsledku

dosáhne už při 128 Kb/s, takže kompresní poměr je zhruba 1:12. S klesající

kvalitou výstupu kompresní poměr roste, takže pokud si doma archivujete své

telefonní hovory, dosáhnete při archivaci v mp3 stejné kvality při kompresním

poměru 1:192. Úspora místa je tedy dosti značná a není divu, že zvukový formát

mp3 brzy začal dobývat Internet.

Na čerstvě opanovaném území se však brzy objevily temné siluety obránců

autorských práv, které se pustily do pronásledování nového zvukového fenoménu s

neúprosností právě podvedené manželky. Nejčastěji přijímaný výklad otázky

autorských práv se přesto dá shrnout do pouhých dvou vět. Od legálně pořízených

(zakoupených) nahrávek máte právo si pro vlastní potřebu pořídit kopie v

libovolném podobě, ať je přepíšete do notového záznamu v provázkovém písmu Inků

anebo do digitální podo-by mp3. Jakmile ovšem takto pořízené kopie umístíte na

server a dáte vplen internetovému lidu, začínáte si zadělávat na slušivou

momentku v policejní databázi (tedy alespoň teoreticky). Důkazem, že řada

tvůrců stránek nočními můrami z houkajících aut, placatých čepic a dobře

nabroušených obušků rozhodně netrpí, je fakt, že dnes už prakticky každé warez

doupě obsahuje sekci s názvem mp3z. Samozřejmě že to neznamená, že každá mp3,

na kterou na Internetu narazíte, je corpus delicti nějakého zločinu, ba naopak,

řada hudebníků a vydavatelů je na své stránky umisťuje záměrně jako určitý druh

reklamy či nabídky zboží.

Dnes už je po datovém poli Internetu roztroušeno na miliony émpetrojkových

kvítků a najít mezi nimi ten, který voní právě vám, není leckdy jednoduchá

záležitost. Existují sice vyhledávací služby, specializované výhradně na

pátrání po mp3 souborech, ale nejspolehlivější způsob, jak získat empétrojky

právě těch vašich favoritů, je, po vzoru Mata a Pata, si „urobit sám“. Věřte,

že stačí jen málo a je to.



Věta první: Grabbery



Tvorba vlastní empétrojky se skládá přesně z tolika kroků, kolik stupňů má

pětistupňové chilli Neda Flanderse. Pro ty, kterým názvy Springfield a

Simpsonovi nic neříkají, doplním, že správná odpověď je ze dvou.

V tom prvním musíte nahrávku převést z nosiče na pevný disk, přičemž výsledkem

obvykle bývá soubor ve zvukovém formátu wav lidově řečeném wavka, která

představuje naprosto věrný digitální záznam v poměru 1:1. Máte-li nahrávku

kdekoliv jinde než na cédéčku, jediný způsob, jak ji převést, je pořídit záznam

přes zvukovou kartu. K tomu vám postačí ten nejobyčejnější zvukový editor,

kablík do zástrčky Line In a pak pochopitelně nějaký ten kazeťák, magnetofon,

fonograf nebo jiné zařízení, z něhož lze vyloudit zvuk. Pokud ovšem převádíte

nahrávku z CD, máte ještě jinou a mnohem lepší možnost. Programy s obecným

názvem grabbery (s úžasným českým ekvivalentem rýpače) jdou na věc jinak. Pokud

pořizujete záznam přes zvukovou kartu, pak se digitální signál z CD-ROMky

převádí na analogový a na zvukové kartě znovu zpětně digitalizuje. Tento postup

ale vždy znamená, že výstup se obohatí o nějaký ten šum. Grabbery zvukovou

kartu ke svému životu vůbec nepotřebují a přepisují audiostopy z cédéčka na

pevný disk bez sebemenší ztráty kvality postupem zvaným grabování. Bohužel ne

všechny CD mechaniky jsou takovémuto převodu nakloněny a některé se přímo

vzpírají. Pokud na adrese www.mp3.com/cdrom.html najdete ve sloupečku „Can Rip“

u vaší CD-ROMky poznámku „No“, máte prostě smůlu. Pokud vaše mechanika ale

ještě nestačila oslavit osmnáct měsíců života, tento problém se vás s největší

pravděpodobností nikdy týkat nebude a na hard disku se vám budou objevovat jen

samé povedené „wavky“. Jediné, co se od vás očekává, je nastavit ve vašem

grabberu atributy výsledného wav souboru, což v případě CD kvality obvykle

znamená zvolit 16bitový záznam (každý vzorek, okamžitý záznam zvuku,

reprezentuje šestnáctibitové číslo), vzorkovací frekvenci 44 100 Hz (počet

zaznamenaných vzorků za sekundu) a stereo (tedy dva zvukové kanály). A

pochopitelně nikdo za vás nerozhodne, který program ke grabování použít.

Ta nejohmatanější láhev v baru „U nejlepšího grabberu“ nesla dlouhou dobu

vinětu s nápisem WinDAC. WinDAC má na straně jedné velmi jednoduché ovládání,

na straně druhé umožňuje pohrát si s řadou parametrů vlastního grabování a

pořídit věrný záznam i z nevhodné mechaniky, nicméně v poslední době začíná v

porovnání s ostatními trochu ztrácet dech. Z těch, které se pokouší zaujmout

jeho místo, je zapotřebí zmínit výborný Audiograbber, jenž má dobré ovládání,

umí normalizovat zpracovávaný záznam, tzn. vyrovnává rozdílné hlasitosti

jednotlivých nahrávek, odstranit pauzy před i za hudební stopou, a pokud máte

vhodný encoder (program na kódování do mp3), nezastaví se u pouhé wavky, ale

rovnou vám vytvoří mp3. Poslední verze má také podporu CDDB, umí se tedy přes

Internet spojit s databázemi vydaných CD, identifikovat grabované album podle

jednoznačného kódu, který každé hudební CD nese, a přiřadit stopám správné

jméno skladby či písničky. Z dalších zajímavých funkcí bych zmínil schopnost

otestovat bezchybnost čtení dat z CD-ROMky, analogové čtení dat pro

negrabovatelné mechaniky, vytváření ID3 tagů a vytváření seznamů skladeb.

Spojením tohoto grabberu s encoderem, vytvořeným firmou Xing technologies,

vznikl vynikající program AudioCatalyst. Ze zbývajících grabberů je snad

zajímavý ještě Easy CD-DA Extractor, který podporuje řadu vnějších encoderů,

dokonce i encoderů jiných formátů než mp3, a vytváří mp3 přímo, aniž by se

zdržoval vytvářením dočasného wav souboru jako ostatní grabbery.



Věta druhá: Encodery



Pokud si váš grabber úspěšně zchladil žáhu na předhozeném cédéčku a obohatil

pevný disk o několik čerstvě narozených wavek, nastal nejvhodnější čas pro

vypuštění encoderu.

Encoder je program, který převádí zvukový záznam z nezkomprimované podoby

formátu wav do komprimované podoby mp3. Opozitem encoderu je decoder, smyslem

jehož existence je naopak převádět záznam z mp3 zpět do wavky.

Encoderů existuje celá řada. Vzájemně je lze porovnávat z několika hledisek,

ale těmi základními (pochopitelně odhlédneme-li od všudypřítomného hlediska

zvaného cena) jsou doba trvání komprese a kvalita výstupu v porovnání s

originálním záznamem. Za jak dlouho daný encoder přetvoří wavku do mp3 a v jaké

kvalitě, závisí zčásti na algoritmu komprese a zčásti na podmínkách, které si

sami stanovíte. Samozřejmě také platí, čím výkonnější počítač, tím lépe.

Srdcem každého encoderu je takzvaný kodek, na němž leží největší tíha

odpovědnosti, jakže to všechno vlastně dopadne. Kodek je v podstatě vlastní

kompresní algoritmus, který encoderu říká, jak má s originálním záznamem

naložit, co zahodit a co ponechat. Za nejlepší kodek se obecně uznává ten

vyvinutý Fraunhoferovým institutem a využívá jej většina z těch lepších

encoderů.

Parametry, do kterých můžete mluvit a dokonce mít při tom dojem, že něco

opravdu ovlivňujete, jsou velikost bitrate (datového toku) a způsob naložení s

kanály (pochopitelně těmi zvukovými). Obyčejně přijímaným standardem, kdy už

neinformovaný jedinec přestává rozeznávat, zda se mu přehrává záznam z

klasického CD anebo z mp3, je bitrate 128 Kb/s. Obecně platí, že čím menší

bitrate při tvorbě mp3 zvolíte, tím bude sice výsledná mp3 menší, ale o to méně

kvalitní. U mp3 s bitrate pod 128 Kb/s už většinou poznáte, že záznam není to

pravé ořechové, a bitrate kolem 64 Kb/s a nižší se hodí pouze pro potřeby

polohluchých babiček. Naopak, hudební labužník s křišťálově vytříbeným sluchem,

trpící při pomyšlení jakéhokoliv pokřivení nebesky dokonalých tónů originálního

CD, může směle nasadit bitrate kolem 192–256 Kb/s (to podle míry oné

vytříbenosti). Kvalitu výstupu můžete do jisté míry ovlivnit i tím, jak vašemu

encoderu přikážete naložit s kanály, přičemž nejlepší výsledky dává obyčejně

volba joint stereo. Zvolit při kompresi volbu stereo je dobrým tahem v případě,

že kódujete wavku, která není produktem grabování, ale kterou jste pořídili

záznamem přes zvukovou kartu.

Z jakých encoderů je tedy možné si vybrat? Nejstarším, a zřejmě i tím

poskytujícím nejkvalitnější výstup, je L3Encoder od Fraunhofer Institutu. L3Enc

je dosovský program a jako takový jej ovládáte z příkazové řádky (existují

ovšem i utilitky, které mu dodají o něco příjemnější rozhraní). Cenou za

oslnivou kvalitu výstupu nejen při vysokých bitrate (umí až 256 Kb/s), jež se

téměř blíží dokonalosti zvlášť pokud použijete volbu HQ (high quality), je

ovšem čas, který L3Enc na kompresi spotřebuje. Konkurentem přistupující k věci

z opačného hlediska je Xing mp3 Encoder. Xing vyvinul originální kodek, jenž je

naopak založen na maximální rychlosti komprese a je postaven na technologii VBR

(variable bitrate), kdy bitrate empétrojky není konstantní, ale operativně se

mění. Zatímco výšky, alias vyšší kmitočty, musí být kódovány s vyšším bitrate,

protože jinak dojde ke zhoršení záznamu, nižším kmitočtům nikterak neuškodí

kódování s nižším bitrate, a tak výsledkem je menší velikost výsledné mp3 při

zachování původní kvality oproti mp3 s konstantní rychlostí. Z rodinky

encoderů, založených na patentovaném Fraunhoferově kodeku, je dobré zmínit se o

Audioactive Production Studio nebo o MPEG Layer-3 Producer professional, které

jejich tvůrci vyšperkovali několika zajímavými funkcemi. Zatímco předchozí

programy hrdě kráčí v palbě warezu pod vlajkou shareware, následující dva nesou

na své virtuální navštívence omamně znějící heslo freeware a jsou tedy zadarmo.

Jmenují se MpegEncoder a Blade\s MP3 Encoder. Autoři vyvinuli své vlastní

kodeky a oba mají velmi podobné rysy. Doba kódování je poměrně dlouhá a zatímco

při vysokých bitrate jsou výsledné mp3 velmi dobré, se snižující se bitrate

jejich kvalita ve srovnání s produkty ostatních encoderů, získaných za stejných

podmínek, výrazně upadá.

Aby nebyly tak úplně opomenuty decodery, jejichž uplatnění je výrazně nižší,

jmenujme alespoň L3Decoder, který je rodným dvojčetem L3Encoderu od

Fraunhoferů, nebo funkci v přehrávači mp3 Winampu.



Věta třetí: Přehrávače



Pokud se vám úspěšně podařilo získat nějaký soubor typu mp3, musíte si ještě

obstarat software, který vám umožní empétrojku přehrát. Takovým programům se

obvykle říká přehrávače (playery). Základní podmínkou, aby vám tyto programy

mohly vůbec něco přehrát, je mít rychlejší počítač. Přesněji řečeno, obvykle

udávaná minimální konfigurace je Pentium na 100 MHz s 8 MB paměti. Procesory

řady 486 a slabší už dekódování mp3 v reálném čase nestíhají, což se v praxi

projeví pauzami a trhaným výstupem. Jste-li ale hrdým majitelem Pentia, stačí

si vybrat některý z dostupných přehrávačů, nainstalovat si jej a pak jste právě

zapíchli svou vlaječku do šošolky empétrojkového světa. Většina lepších

přehrávačů navíc umožňuje přehrávat řadu dalších zvukových formátů včetně

zvukového CD a vkládat do souboru mp3 dodatečné informace ve formě takzvaných

ID3 tagů, které slouží k zaznamenání jména skladby, interpreta, alba a krátkého

komentáře, a lyrics tagů, do nichž je možné vložit text písně, který pak

přehrávač zobrazuje při přehrávání mp3 ve zvláštním okně a podle časových

značek zvýrazňuje aktuální úryvek.

Za nejlepší (nejen) mp3 přehrávač je většinou uživatelů pokládán Winamp od

firmy NullSoft. Winamp podporuje velké množství zvukových formátů, umí přehrát

VBR mp3 a má mimo desetipásmového ekvalizéru pestrou škálu funkcí (regulaci

balance, vlastní ovládání hlasitosti, autorepeat, přehrávání skladeb v náhodném

pořadí, osciloskop, vytvoření wav souboru ze vstupní mp3 v reálném čase a

další). Další jeho předností je výborně udělaný editor seznamů skladeb. Winamp

podporuje a dovoluje editovat ID3 tagy, které umožňují do mp3 souboru vložit

dodatečné informace. Dalšími vynikajícími funkcemi, díky nimž je Winamp

oblíben, je podpora pluginů, dodatečných knihoven, které rozšiřují jeho

schopnosti, a takzvaných „skins“, jednoduše vyměnitelných podob přehrávače. V

podstatě se dá říct, že Winamp si můžete sami nakreslit, ale pokud se vám do

toho nechce a standardní vzhled se vám příliš nezamlouvá, na jeho domovské

stránce si můžete vybrat z téměř 2 500 možností.

Pokud některé přehrávač mohou konkurovat Winampu, pak jsou to Unreal player

Max, K-jÖfol a Sonique. Unreal player Max je sharewarový produkt firmy 303tek a

verzi od verze se svými schopnostmi Winampu přibližuje. Umí přehrát ještě

pestřejší řádku zvukových formátů než Winamp, má pěkný editor seznamů skladeb,

řadu efektů, podporu lyrics tagů a mnoho dalšího. Velkou předností je

optimalizace i pro MMX a neintelovské procesory. Druhým ze skupinky lovců

Winampu je K-jÖfol spáchaný firmou Aegis. Mezi klady tohoto stále lepšího

freewarového programu patří 32pásmový ekvalizér, pěkný design, který umožňuje

rozmístit si jednotlivé ovládací prvky tak, jak se vám líbí, ovládat rychlost

přehrávání, schopnost přehrávat mp3 ve VBR formátu, oproti Winampu (ten

vyžaduje plugin) dokonce i záznamy ve VQF a AAC formátu, kterým zřejmě patří

budoucnost, a v neposlední řadě i poměrně malá zátěž procesoru během

přehrávání. Posledním z těch, jež se pevně drží Winampu za virtuální kotník, je

freeware Sonique. Je to graficky velmi pěkně zpracovaný přehrávač podporující

spoustu zvukových formátů, má vlastní dvacetipásmový ekvalizér, pestrou škálu

přehrávacích funkcí a zabudovaný dekodér. Ze čtyř doposud zmíněných přehrávačů

však vykazuje nejvyšší zatížení procesoru.

Na závěr si dovolím poznámku o tom, že přehrávače mp3 už nemají jen podobu

softwaru na vašem mp3. Řada firem uvažuje o tom, že bude vyrábět kapesní mp3

přehrávače, a některé se k tomuto dokonce již odhodlaly. Nejznámějším je

přehrávač firmy Diamond jménem Rio a podle recenzí mp3 přehrávat opravdu umí.

Rio si dovede nahrát do paměti mp3 z PC přes paralelní port a zvládne to i

opačně, bohužel kapacita paměti není prozatím příliš velká (32 MB), takže se do

ní bez externí karty vejde asi osm písniček. Krom okrouhlé sumičky 150 dolarů,

které si za něj Diamond žádá, je to zřejmě zatím jediná výraznější vada,

zabraňující významnějšímu rozšíření přehrávače mezi prostý lid.



Finále: Boj o žezlo



Jakkoliv je formát mp3 v současné době nejrozšířenější a nejpoužívanější, dá se

s jistotou říci, že doba jeho panování v říši komprimovaného zvuku nebude

neomezená. Už v dnešní době vyvinuly některé firmy formáty, které MPEG layer 3

v řadě ohledů předčí. Hlavní úsilí je napřeno na vývoj formátů s

propracovanějšími technologiemi ztrátové komprese, které by zajistily dobrou

reprodukci i při nízkých hodnotách bitrate a umožňovaly tedy kvalitní přenos

zvuku po Internetu. Dosavadní jedničkou v oblasti zvuku při velmi nízkých

datových tocích, která ještě dlouho zůstane nepřekonána, je RealAudio, ale

zpoza obzoru záznamů v CD kvalitě už k němu pomalounku začíná doléhat funění

několika nových formátů. Těmi nejčastěji zmiňovanými, a využitými při vývoji

zbrusu nového standardu pro kódování audiovisuálních objektů MPEG-4, jsou

formáty s poetickými názvy VQF a AAC.

Ten starší zakřičel poprvé na svět ve sklepeních laboratoří firmy Yamaha. VQF

(Vector quantization file) ušetří oproti mp3 při stejné kvalitě třetinu místa,

na rozdíl od ní ovšem neobsahuje zvukové stopy, vyžaduje výkonnější hardware a

má slabou softwarovou podporu.

Formát AAC (Advanced audio coding) původně vyvinula firma Astrid/Quartex. AAC

využívá nových přístupů k „ošizení“ lidského ucha a v porovnání s mp3 dosáhne

stejné kvality záznamu při necelých třech čtvrtinách délky. Jeho výhody se ale

promítají hlavně do záznamů typu surround, tedy s větším počtem kanálů.

Další formáty, které se zapojují do souboje na tomto poli, jsou třebas PAC, A2b

music, nebo Liquid Audio. O tom, jestli některý z nich spláchne mp3 do

propadliště dějin, zřejmě rozhodne definitivní podoba druhé verze standardu

MPEG-4, respektive podoba jeho zvukové vrstvy, a pak samozřejmě ochota

jednotlivých firem vytvořit pro takový formát softwarové zázemí.9 0530/JL o



Relevantní odkazy



Stránky o mp3:

www.mpeg.org

www.mp3.com

mpx.system.cz

Vyhledávač mp3: mpx.system.cz/search.htm

Fraunhofer Institut: www.iis.fhg.de

Databáze CD: www.cddb.com

Texty písní: www.lyrics.ch

MPEG-4: drogo.cselt.it/mpeg/