Náš seriál je určen studiovým technikům, muzikantům, počítačovým maniakům a všem ostatním, pro něž pojmy digitální záznam nebo hard disk recording nejsou úplně neznámé.
Budeme se věnovat především firmě Digidesign, která je mezi výrobci HDR systémů světovou jedničkou, a jejíž systém Pro Tools je nejrozšířenějším HD recordingem na světě i u nás. Řeč bude o počítačích Macintosh (nazapomeneme však ani na příznivce platformy PC), o jednotlivých systémech firmy Digidesign, včetně nejrozšířenějšího systému Pro Tools. Dozvíte se o jejich vlastnostech a možnostech, výhodách i nevýhodách, způsobech použití, včetně speciálních aplikací (post-produkce, dabing, mastering). Testovat budeme také výrobky dalších firem, spolupracujících s Digi-designem (výrobci efektového softwaru, synchronizačních periferií, MIDI techniky). Stávající uživatele seznámíme s nejrůznějšími tipy a triky. Součástí každého článku bude také technická poradna, ve které se budeme snažit vyřešit vaše praktické problémy s používáním systémů HD recording.
Nepochybuji o tom, že náš seriál bude nepochybně trnem v patě škarohlídů, úporně lpících na analogové technice, takže než se začneme věnovat jádru věci, jistě neuškodí zopakovat si na úvod několik pojmů z teorie digitálního záznamu. Půjde o výklad velmi stručný. Zájemci o bližší seznámení s touto problematikou však nemusí být smutní. Tématice digitálního záznamu se budeme (kromě jiného) podrobněji věnovat v našem dalším pravidelném seriálu s názvem „Teoretická kuchařka muzikanta“, který začne vycházet počínaje příštím číslem MUSIC STORE.
Digitalizace zvukového záznamu
Převod analogového signálu do digitální podoby provedeme následovně. Spojitý analogový signál (např. zvuk snímaný mikrofonem) nejprve navzorkujeme. Proces vzorkování si osvětlíme na následujícím příkladě. Představme si pravidelnou posloupnost velmi úzkých, stejně vysokých a stejně širokých impulsů (označeny hnědou barvou na obr. 1). Řekněme, že impulsů bude třeba 44.100 za sekundu. V okamžiku „vystřelení“ impulsu budeme z analogového signálu (znázorněného červeně) odebírat vzorky. Výsledným vzorkovaným signálem je tedy řada impulsů - vzorků, jejichž výška je rovna okamžité hodnotě původního analogového signálu. Pokud ze signálu odebereme zmíněných 44.100 vzorků za sekundu, znamená to, že vzorkovací frekvence, označovaná někdy jako SR (sample rate), je 44.100 Hz. Pro zajímavost ještě uveďme, že jednotlivé sousedící impulsy budou v tom případě vzdáleny 1/44.100 s = 0,023 ms.
Dá se říct, že naším analogovým signálem vlastně modulujeme (tedy ovlivňujeme) velikost jednotlivých vzorkovacích impulsů. Proto se také proces vzorkování někdy označuje zkratkou PAM (pulsní amplitudová modulace). Ještě častěji se pro vzorkování používá termín sampling (z anglického sample = vzorek).
Výsledkem vzorkování je diskrétní (tedy časově kvantovaný) signál. V obr. 1 je znázorněn modrou barvou. Ale pozor! Jedná se stále o signál analogový, neboť jednotlivé vzorky mají v okamžicích vzorkování přesně stejné hodnoty, jako měl původní spojitý signál.
Analogově - digitální převodník
Ze vzorkovacích obvodů pokračuje signál do A/D převodníku, označovaného v anglické terminologii zkratkou ADC (analog to digital converter). Již z názvu vyplývá, že vstupem pro A/D převodník je navzorkovaný analogový signál (znázorněný modře na obr. 1) a výstupem pak digitální PCM signál. Analogově - digitální převodník provádí dvě základní operace. Jednak úrovňové kvantování signálu a dále PCM kódování, neboli převod úrovňově kvantovaného signálu do digitální podoby. Celou situaci si nyní blíže vysvětlíme.
Při úrovňovém kvantování zaokrouhlujeme velikostí jednotlivých vzorků signálu na nejbližší hodnotu určitého vhodně zvoleného rastru. Tímto rastrem je síť vodorovných zelených čar na obr. 2. Modrý signál v obr. 2 je již podle tohoto rastru zaokrouhlený (tedy úrovňově kvantovaný). Zatímco vzorky modrého signálu z obr. 1 přesně kopírovaly tvar původního analogového signálu, velikosti vzorků úrovňově kvantovaného signálu na obr. 2 jsou „chyceny“ na nejbližší hodnotu kvantizačního rastru.
Proč vůbec velikosti vzorků zaokrouhlujeme? Jednoduše proto, abychom je mohli vyjádřit konečným počtem bitů. Všiměme si příkladu na obrázku 2. Náš rastr má zde 16 úrovní. 16 různých kombinací můžeme ve dvojkové soustavě vyjádřit čtveřící bitů. Bit je základní informační jednotka, nabývající buď hodnoty 0 (nízká úroveň) nebo 1 (vysoká úroveň). Informa-ce o velikosti každého vzorku má tedy hodnotu 4 bitů (proto se jedná o 4-bitový A/D převodník) a lze jí vyjádřit 24, tedy 16 různých velikostí vzorků. Analogový vzorek mohl nabývat nekonečně mnoha hodnot. Kvantovaný vzorek může ale nabývat pouze jedné z 2n různých hodnot, kde n je počet bitů příslušného A/D převodníku. A to je to, co potřebujeme. Kdybychom vzorky nezaokrouhlovali (jinými slovy - kdybychom velikost každého vzorku chtěli vyjádřit s nekonečně velikou přesností), potřebovali bychom k tomu nekonečný počet bitů!
Bude-li kvantovací rastr dostatečně hustý, chyba vzniklá zaokrouhlením bude velmi malá a náš sluch ji neodhalí. 4-bitový A/D převodník z našeho příkladu je pro zpracování zvuku nepoužitelný. Nejmenší použitelné rozlišení pro digitální audio je 8 bitů. V osmi bitovém A/D převodníku zaokrouhlujeme velkosti jednotlivých vzorků signálu na jednu z 256 hodnot rastru (28), u 16 bitového převodníku bude mít rastr dokonce 65.536 hodnot (216).
Po úrovňovém kvantování přichází na řadu PCM kódování (zkratka PCM označuje pulsní kódovou modulaci - tedy kódování velikostí impulsů do digitální podoby, reprezentované nulami a jedničkami). Při PCM kódování musíme velikost každého zaokrouhleného vzorku vyjádřit ve dvojkové soustavě. U 8 bitového záznamu to zvládneme pomocí osmi nul či jedniček, tedy 8 bitů. A u nejrozšířenějšího 16 bitového záznamu musíme každý vzorek vyjádřit slovem s 16 nulami či jedničkami (tedy 16 bity).
Původní analogový signál jsme tedy pomocí vzorkovacích obvodů a A/D převodníku zakódovali do digitálního PCM signálu, tvořeného řadou slov, které vyjadřují velikosti jednotlivých vzorků. Prohlédněme si digitální PCM signál na obr. 2. Každé slovo se skládá z posloupnosti nul (vyjá-dřEných např. napětím 0V) a jedniček (např. napětí 5V). Tyto nuly resp. jedničky pak můžeme uložit na nějaké vhodné médium - třeba na hard disk počítače.
Spočítejme ještě pro zajímavost kapacitu, kterou bude zdigitalizovaný zvuk na hard disku zabírat. Mějme 16 bitový záznam, vzorkovaný frekvencí 44,1 kHz. Za sekundu je odebránu 44.100 16 bitových vzorků, proto 1 sekunda zabere 44.100 x 16 = 705.600 bitů. V praxi se většinou používá jednotka byte (čti bajt) se značkou B, přičemž 1 B = 8 bitů. Zmíněná 1 sekunda proto zabere 705.600/8 = 88.200 B. Minuta pak zabere 60 x 88.200 = 5.292.000 B = 5,29 MB (mega bytů). V praxi vystačíme se snadno zapamatovatelnou relací: stereofonní minuta v CD kvalitě (44,1 kHz/16 bitů) zabere přibližně 10 MB.
Zpět do analogové podoby
Analogový signál jsme úspěšně zdigitalizovali. Ale jak dostat posloupnost jedniček a nul uložených na hard disku znovu do zvukové podoby? Provedeme to pomocí D/A (tedy digitálně - analogového) převodníku, který převede digitální PCM signál zpět do analogové for-my. Vstupem D/A převodníku je digitální PCM signál, výstupem z D/A převodníku je pak schodovitý signál, označený v obr. 3 modrou barvou. Výška jednotlivých „schodů“ samozřejmě odpovídá velikosti vzorků kvantovaného signálu z obr. 2.
Získaný analogový signál musíme ještě vyhladit. Os-tré hrany signálu se ve spektru projeví jako vyšší harmonické frekvence. Abychom tyto hrany „zakulatili“, musíme vyšší harmonické potlačit. Provedeme to pomocí filtru typu dolní propust se zlomovým kmitočtem rovným polovině vzorkovacího kmitočtu (t.j. 22,05 kHz). Takový filtr si můžeme představit jako ekvalizér, kterým velmi strmě potlačíme všechny frekvence vyšší než 22,05 kHz (nižší frekvence projdou beze změny). Získáme vyhlazený analogový signál (znázorněný v obr. 3 plnou červenou čarou), který zbývá jen zesílit reprodukčním řetězcem.
Všimněme si, že přehrávaný signál (plná červená čára v obr. 3) není zcela shodný s původním analogovým signálem (čárkovaná červená čára). Je jen jeho více či méně přesným přiblížením - aproximací. Bude-li však tato aproximace dostatečně přesná, náš sluch nic nepozná a my máme vyhráno. Hlavní roli zde hrají 2 faktory - vzorkovací kmitočet a bitové rozlišení převodníků. Obecně lze říci, že čím vyšší bude vzorkovací frekvence a bitové rozlišení A/D resp. D/A převodníku (jinými slovy - čím hustší bude síť žlutých a zelených čar v obr. 3), tím kvalitnější a přesnější výsledek dostaneme.
Vzorkovací kmitočet
Vzorkovací kmitočet musí být minimálně dvojnásobný, než je nejvyšší kmitočet, obsažený v kmitočtovém spektru signálu, jež chceme vzorkovat. Této poučce se říka Shannon-Kotělnikovův vzorkovací teorém. Takže například při použití vzorkovacího kmitočtu 32 kHz můžeme vzorkovat pouze signály, v jejichž spektru je nejvyšší kmitočet 16 kHz (při vzorkování vyšších kmitočtů by došlo ke slyšitelnému zkreslení ve výškách). Proto analogový signál ještě před vstupem do vzorkovacích obvodů a A/D převodníku omezíme filtrem dolní propust se zlomovým kmitočtem rovným polovině vzorkovacího kmitočtu (je to stejný filtr, jaký jsme použili pro vyhlazení signálu na vý-stupu D/A převodníku).
Dejme tomu, že používáme vzorkovací frek-venci 44,1 kHz. Náš červený analogový signál z obr. 1 tedy musíme ještě před samotným vzorkováním a A/D převodem omezit filtrem, který odstraní všechny frekvence vyšší než 22,05 kHz. Tyto frekvence stejně neslyšíme a informační obsah nahrávky se proto nezmění.
Počet bitů A/D převodníku, kvantizační šum
Jak již bylo řečeno, počtem bitů vlastně nastavujeme rastr (viz. zelené čáry v obr. 2 a 3), podle něhož budeme navzorkovaný signál kvantovat (rastr bude mít 2n hodnot, kde n je počet bitů). Zaokrouhlováním vzorků při kvantování vzniká chyba, která se projevuje jako tzv. kvantizační šum. Podívejme se na úrovňově kvantovaný signál pod lupou (viz. obr. 4). Kvantizační šum není nic jiného, než rozdíl mezi zaokrouhleným signálem a původním analogovým vzorkovaným signálem. Tento rozdíl je vyznačen v obr. 4 šedou plochou. Jestliže užitečnému signálu odpovídá modrý průběh, pak pomyslnému šumovému signálu odpovídá šedý průběh, znázorněný ve spodní části obr. 4. Velikost kvantovacího šumu lze celkem snadno určit - je rovna maximálně výšce jednoho řád-ku v našem zeleném kvantizačním rastru.
Odstup signál/šum
Známe-li velikost signálu i šumu, můžeme snadno zjistit odstup signál/ šum, často označovaný jako S/N nebo SNR (signal to noise ratio). U digitálního záznamu můžeme odstup přibližně spočítat podle vztahu S/N = 6n [dB], kde n je počet bitů. S osmi bitovým signálem lze tedy dosáhnout odstupu 48 dB, s 16 bitovým 96 dB a s 24-bitovým pak 144 dB. Odstup signál/šum lze ještě dále vylepšit pomocí technologie, které se říká oversampling (převzorkování).
Vzhledem k prakticky užívanému dynamickému rozsahu lidského sluchu (cca 100 - 110 dB) se 16 bitový záznam jeví jako celkem dostatečný (viz. obr. 5). Experimenty s 20 nebo 24 bitovým záznamem však už nejsou jen výstřelkem budoucnosti, takže nezbývá než čekat, čím nás technický vývoj překvapí v příštích letech.
Upozorňuji, že výklad v předchozích odstavcích byl velice, velice zjednodušený (teoretici by mě ukamenovali), a že situace je ve skutečnosti daleko složitější. Ale vysvětlování pojmů jako oversampling, spektrum vzorkovaného signálu, aliasing, rozptyl kvantizačního šumu, noise shaping nebo dither by svým rozsahem zabralo celé číslo tohoto časopisu. Nezoufejte však, k těmto tématům ještě zabrousíme v našem seriálu „Teoretická kuchařka muzikanta“.
Výhody a nevýhody digitálního záznamu
Zopakovali jsme si hlavní technické aspekty digitálního záznamu. Běžného uživatele ale určitě zajímají hlavně jeho výhody, vůči záznamu analogovému. Předností existuje několik. Digitální záznam je úžasně odolný. Zatímco u analogového pásku se každým přehráním vlastnosti magnetické vrstvy zhoršují a kvalita nahrávky (i když třeba velmi pomalu) klesá, nahrávka zaznamenaná digitálně bude hrát pořád stejně. Záznam na hard disku je sice také magnetický, ale je především digitální (a samovolně udělat z digitální nuly digitální jedničku není nikterak jednoduché).
Odstupy signál/šum digitálního a magnetického analogového záznamu jsou srovnatelné. Ovšem analogové systémy dosahují těchto odstupů jen díky dynamickým kompandérům (Dolby S, dbx apod.). Komprese při záznamu a expanze při přehrávání nejsou nikdy přesně inverzní, a při použití kompandérů tudíž dochází k určité dynamické chybě. Další nespornou výhodou digitálního záznamu je malé zkreslení (dané pouze nelinearitou A/D resp. D/A převodníků). Naproti tomu u analogového magnetického záznamu vzniká zkreslení lichými harmonickými, dané samotným principem magnetického záznamu.
Všechny zmíněné výhody digitálního záznamu vynikají především v okamžiku, kdy veškeré zpracování zvukového snímku provádíme kompletně v digitální formě. Od nahrání na hard disk je tedy střih, mixáž, efektový processing i mastering prováděn pouze digitálně (tedy v podobě reprezentované nulami a jedničkami PCM signálu). Smíchaný a zmasterovaný snímek pak můžeme digitálně přepsat na R-DAT nebo vypálit na CD pomocí CD-R zapisovačky.
Digitální záznam má však i některé nevýhody. Naroz-díl od analogového záznamu jej nemůžeme přebudit. Při přebuzení dochází k limitaci signálu v A/D převodníku a ke slyšitelnému zkreslení. Proto je potřeba postupovat při na-hrávání opatrně a hlídat jednotlivé úrovně vybuzení. Další věc, která je digitálnímu záznamu vytýkána, je tvrdý, chemický či syntetický zvuk. Při používání kvalitních A/D a D/A převodníků však nelze brát tyto úvahy příliš vážně (uvědomme si, že drtivá většina hu-dební produkce skončí stejně na CD nosiči - tedy na digitálním médiu).
Měkčí charakter zvuku analogových zařízení je způsoben hlavně zmíněným zkreslením magnetického záznamu lichými harmonickým. Ale i tyto „problémy“ se snaží výrobci digitálních HDR systémů řešit. Pro zaryté analogisty dodává firma Digidesign k systémům Pro Tools např. digitální efektové moduly D-Fi, simulující zvuk analogových systémů (analogový šum, jemné zkreslení, kolísání pásku atd.).
Izraelská firma ksWAVES nedávno představila efektový modul Renaissance Compressor (viz. obr. 6). Je to skvělá digitální simulace lampového kompresoru, který si nezadá s „rackovými“ přístroji v cenové kategorii řádu tisíců USD. Takže i ortodoxní analogisté mohou nyní požívat všech předností digitálních systémů hard disk recording a přitom se těšit z měkkého analogového zvuku.
Suma sumárum ... aneb co bychom si měli z dnešního dílu zapamatovat.
V našem prvním dílu bylo teorie až příliš, ale to jednou za čas neuškodí. Slibuji, že příští díl seriálu bude podstatně zajímavější. Seznámíme se totiž se základními pojmy, týkajícími se systémů hard disk recording. Nezapomeňte nám psát své náměty, připomínky a dotazy.