Princip ukládání zvuku do PC - ostatní

Autor: Michael Davidík | 05.12.2004
Žánr:  PC  | Ostatní
Homepage: --
Jak je možné, že celé audioCD se nám vejde na USB disk a ani nepoznáme rozdíl v kvalitě? Proč se CD neprodávají tedy v MP3 formátech? Pokud si někdo z vás někdy kladl tuto otázku, tak právě vám je tento článek věnován.
Jak je možné, že celé audioCD se nám vejde na USB disk a ani nepoznáme rozdíl v kvalitě? Proč se CD neprodávají tedy v MP3 formátech? Pokud si někdo z vás někdy kladl tuto otázku, tak právě vám je tento článek věnován. Cílem bude stručně a co nejjasněji vysvětlit základní prncipy ukládání hudby a jejich zprostředkování. [b] Zvuk na PC, zvuk z CD [/b] Jak všichni zajisté již ze základní školy víme, slyšitelný zvuk je vlnění vzduchu o frekvencích přibližně od 20Hz do 20kHz. Toto pásmo se s přibývajícím věkem posluchače snižuje a to značně, např. i na 12kHz. Ale abych zde nevyužíval věci a jednotky, o kterých třeba někdo neví, co znamenají, musím je předem definovat. Takže 1 Hertz (Hz) je jednotka FREKVENCE. Frekvence 1Hz je frekvence vlnění (nejen zvuku, prostě vlnění či periodického jevu (opakovaného)), kde perioda činí dobu 1s. Periodou rozumíme usek vlnění, který se opakuje (velice stručné vysvětlení), dále budeme potřebovat pojem AMPLITUDA, který lze stručně definovat jako maximální hodnotu vlnění v periodě, vše viz. obrázek: Zvuk na CD je uložen ve formátu PCM, neboli Pulse Code Modulation. Znamená to, že signál se NAVZORKUJE a Peak hodnoty se uloží sekvenčně do souboru. Vzorkování znamená vlastně "rozsekání" signálu na části, což je velice výhodné pro digitalizaci signálu - viz. dále. Peak hodnotami rozumíme hodnoty vzdáleností maxim vzorků od nulové hodnoty (klidové). Tato maxima jsou hodnoty, které se ukládají do souboru, např. Wav, pomocí kterých později můžeme zvuk vlastně zpětně vyrobit. Samozřejmě na povrch se dostává otázka, jaká vzorkovací frekvence je ta správná. Při větším počtu vzorků se soubor rapidně zvětšuje (zdvojnásobení vzorkovací frekvence znamená zdvojnásobení velikosti souboru). Obecně platí pravidlo, které říká, že pro syntézu zvuku o frekvenci F je potřebná vzorkovací frekvence 2F. Lépe pochopitelné by to mohlo být např. z obrázků: Zvuk na audio CD je tedy uložen bez jakékoli komprese. Proto je ho možné přehrát velice snadno prakticky na každé optické CD mechanice. Vzorkovací frekvence zvuku na CD je 44100Hz, takže nejvyšší možná frekvence na CD uložená je 22050 Hz - což je s velkou rezervou nad slyšitelnou hranici. Nutno podotknouti, že vzorkovací frekvence není jediná možná veličina, která ovlivní velikost výsledného souboru. Pokud se vrátíme k obrázku se vzorky, vidíme, že nemají jen šířku, ale i velikost, která je vlastně to, co "dělá zvuk". Zvuk, jak ho známe je spojitá veličina, což znamená že neexistuje místo, kde by došlo ke skoku za nulový čas, vždy je na každou změnu tlaku vzduchu potřeba jistý čas. Ovšem jak jste si jistě všimli, jednotlivé vzorky jsou přesně velké a žádná mezera mezi nimi není. Takže signál, který při přehrávání vyrábíme vlastně není spojitý, i když se tak vlastně chová. Čistě spojitý by byl, kdyby se počet vzorků limitně blížil k nekonečnu, takže by vzorky byly limitně nekonečně úzké (nulové). Poté by i rozdíl mezi jednotlivými vzorky byl limitně nulový, takže by byl vlastně spojitý. Jenže to bychom potřebovali na jakkoli dlouhou Wav (krom nulové délky) nekonečně velký HDD a k výrobě takového HDD by bylo zapotřebí nekonečně materiálu a nekonečné energie, což se v Čechách nevyplatí, takže se to neřeší a nechává se signál nespojitý :-) Ale protože jednotlivé vzorky jsou různě velké, je potřeba pro vymezení jejich délky různě velkého čísla. Někdy jste si určitě všimli, že se píše při přehrávání např. hodnota "kvalita 16bit". Ano, je to přesně tak, jak si myslíte - na každou hodnotu velikosti vzorku je potřeba číslo s 16bitovou přesností. Tato přesnost je pro lidské ucho poměrně dostačující, takže se využívá i na CD a hudebních souborech. Nekteré hudební formáty podporují např. 24bit přesnost, střihačské zvukové karty dokonce 96bit. [b] Komprese zvuku do MP3, WMA [/b] Pokud by všechna hudba měla být pouze na CD, asi by v každé domácnosti byl zapotřebí náklaďák, protože výše popsaný způsob ukládání zvuku prostředky vyloženě nešetří. Proto jsou neustále vyvíjeny komprimátory na media a zvuk. Již v 70. letech 20. století se poprvé objevil kód komprimace souborů. Komprimace využívala tzv. Huffmanova kódu, kteý vlastně ukládá opakující se sekvence znaků pomocí menšího počtu znaků, než je originál. Tato metoda je velice rychlá, poměrně efektivní, avšak i Wav soubor o velikosti 80MB (běžná osmiminutová písnička) je zkomprimován např. na 40MB - a to by byl úspěch. Takže se muselo ve vývoji pokračovat a bylo potřeba najít NĚCO, co by dokázalo hudbu zprostředkovat běžným uživatelům. V době, kdy se velikost disku pohybovala kolem 40MB bylo nemožné uložit CD. Metoda [b]bezztrátové komprese[/b], jako např. Huffmanovým kódem byla pro takové aplikace dosti neefektivní, i přes její vylepšení, např. metoda jednookruhová, kdy se do bufferu uloží sekvence znaků a ta se prozkoumává a ukládá se zase po sekvencích (např. ARJ, AR6 apod...), až po dvou i víceokruhové (RAR, ZIP), dosahovalo se komprese max. na 30% délky původního souboru. Proto se u médií začala používat tzv. [b]ztrátová komprese[/b]. Tato komprese se nedá použít pro bězný typ souborů, jako je např. EXE či TXT, protože, jak již z názvu vyplývá, se při kompresi něco "zapomene" a tím se dosti ušetří. Ono "dosti" je doopravdu "hodně dosti", protože při minimálně poznatelném hudebním zážitku se např. soubor MP3 dá zkomprimovat v poměru 1:12 původní velikosti. Ztrátová komprese využívá tzv. akustického modelu. Prvním velkým omezením velikosti je ukládáním pomocí tzv. rámců, kdy se ukládají do souboru hlavní peak hodnoty jen jendou během rámce a zbytek se uloží rozdílovou metodou, kterou se dá poměrně slušně ušetřit - viz obrázek: Jak je na obrázku vidět, MP3 dokáže ušetřit právě na nedokonalosti lidského ucha. Ztrátová komprese se tomu tedy říká proto, že výsledný zvuk neobsahuje některé zvuky, které byly v originále. Avšak lidské ucho tuto změnu ani nezaznamená, takže mu připadá, že je v CD kvalitě. Při MP3 se za CD kvalitu považuje 160kbit CBR (Constant BitRate) anebo 140kbit VBR nebo ABR (Variable BitRate nebo Average BitRate). [b] Komprese zvuku do OGG [/b] Zvukový formát OGG je narozdíl od MP3 formátem poměrně novým, neexistují ani běžné OGG přehrávače. Důvod je prostý, OGG spotřebuje hodně systémových prostředků, protože komprimace je ještě kvalitnější, než-li u MP3. Přehrávače by tedy v současnosti musely být vybaveny rychlými procesory a to by bylo příliš drahé. OGG narozdíl od MP3 používá vyššího akustického modelu, což znamená, že komprimace probíhá vlastně většími ztrátami. Dokonce ztrátami tak velkými, že OGG při bitrate 80kbit je poměrně slušná CD kvalita. Ovšem později při bitrate nižších než 70kbit se dostáváme k "nebezpečné hranici", kde se kvalita silně zmenšuje, dokonce prudčeji, než u MP3, takže pokud potřebujete soubor s bitrate 50kbit, spíše doporučuji použít MP3, než-li OGG :-) Dalším rozdílem je, že OGG je naprogramován VOLNĚ, není tedy komerční, jako MP3, jeho zdrojové kódy jsou přístupné veřejnosti. Dále pak MP3 je schopna uložit 2, MP3-PRO 4 kanály zvuku, OGG prý až 64 - prakticky nevyzkoušeno, takže neručím za zde uvedenou informaci. Vyzkoušeno však bylo přehrávání a OGG je formát opravdu již vysoce kvalitní a pokud nebudete vyloženě potřebovat MP3, doporučuji pro uschovu OGG.

Detaily

Platforma: PC
Doporučená konfigurace: --

Chcete vidět další Ostatní platformy PC? Přejděte na stránku PC Ostatní.