Co to jest mp3?

Opublikowany Ciekawostki o mp3 on Kwiecień 18th, 2010 przez zasysamy.pl

MP3 (ang. MPEG-1/2 Audio Layer-3) – standard (format) zapisu dźwięku poddanego stratnej kompresji.

Format ten został stworzony w 1991 roku w Niemczech w mieście Fraunhofer-Institut für integrierte Schaltungen. Podczas tworzenia pierwszego wykonania użyto między innymi piosenki Suzanne Vegi Tom’s Diner w celu dostosowania kompresji do brzmienia ludzkiego głosu. Format używa modelu psychoakustycznego. Pliki w tym formacie mają rozszerzenie. Mp3.

Sam MPEG-1 i 2 są przeznaczone do stratnego kodowania sekwencji wideo (film) i opierają się na zmodyfikowanej dyskretnej transformacji cosinusowej. To również może kodować audio na trzy sposoby (Layer 1, Layer 2 i Layer 3). Chociaż samo kodowania dźwięku używa innej metody kompresji. Layer 3, jako najbardziej zaawansowana został zastosowany do nagrywania dźwięku. Wpływ na to mogła mieć elastyczność standardu – pozwala on na zapis dźwięku z pominięciem obrazu i zapewnia dobrą jakość nawet przy dużej kompresji.

Standard opisuje jedynie format zapisu. Wszystkie urządzenia i oprogramowania są w stanie zapisać w formacie audio lub odczytać zgodne z tym formatem.

Dla dźwięku stereofonicznego format MP3 stosowane się tryby kompresji:

  • dual channel – w którym dźwięk jest zapisywany jako dwa odrębne kanały monofoniczne.
  • stereo (stereo mode 0) – w którym każda ramka zapisywana jest algorytmem left/right stereo.
  • joint stereo (stereo mode 1) – w którym dla każdej ramki wybierany jest najlepszy dla niej algorytm zapisu dźwięku stereo.

Stosowanymi w kompresji MP3 algorytmami kodowania ramki dźwięku stereofonicznego są:

  • left/right stereo (simple stereo, independent channel) – w którym dźwięk w kanałach prawym i lewym jest kodowany niezależnie, może jednak zmieniać się liczba bitów przeznaczonych na każdy z kanałów. Efektywny dla ramek, w których oba kanały różnią się w dużym stopniu.
  • middle/side stereo – w którym sygnał stereo kodowany jest w postaci pary wartości oznaczających sumę (L+R) oraz różnicę (L-R) kanałów. Efektywny dla ramek, w których oba kanały przyjmują podobne wartości.
  • intensity stereo – w którym sygnał stereo dla niektórych (głównie wysokich) częstotliwości kodowany jest jako monofoniczna wartość uzupełniona o wektor określający kierunek, z którego dochodzi dźwięk. W praktyce stosowany tylko przy niskiej przepływności (poniżej 80 kbps). Niektóre enkodery (np. LAME) w ogóle nie stosują tego algorytmu.