MP3

Äänitiedostomuoto

MPEG-1 Audio Layer 3 (lyhyesti MP3[1]), tiedostotunnukseltaan yleensä MP3, on MPEG-1-standardiin perustuva äänenpakkausmenetelmä, joka on noussut hallitsevaksi tiedostomuodoksi musiikin jakelussa.

MPEG-1 Audio Layer 3
Tiedostopääte .mp3
Mediatyyppi audio/mp3
Omistaja vapaa
Tiedoston tyyppi audio
Säilöjä yksin tai MPEG-1
Lyhenne MP3
Standardi(t) MPEG-1

MPEG (Moving Picture Coding Experts Group) on lyhenne joukolle digitaalisia pakkausformaatteja.[2] MP3:sta koskee kaksi ISO/IEC standardia, jotka ovat MPEG-1 11172-3 ja MPEG-2 13818-3.[3] Ranskalainen Thomson SA ja saksalainen tutkimuslaitos Fraunhofer-Gesellschaft omistivat MP3:n keskeisimmät patentit.[4] Fraunhoferin vuonna 2005 saamat lisensointitulot olivat noin 100 miljoonaa euroa.[5] MP3-patentit vanhenivat huhtikuussa 2017, joten se on nykyisin vapaa tiedostoformaatti.[6]

Äänenlaatu

muokkaa

Tavallisen MP3:n mainostetaan olevan ”lähes CD-tasoista ääntä”. Alkuperäinen ääni onkin todennäköisesti ollut CD-tasoista 44 100 hertsin näytetaajuudella tallennettua 16-bittistä stereoääntä. Tästä äänestä on häviöllisen pakkauksen menetelmillä karsittu ääni-informaatiota, jota ihmiskorva ei helposti erota (”psykoakustinen mallinnus”[7]). Ääni jaetaan taajuuskaistoihin, jolloin merkityksettömien äänten erottaminen helpottuu. Äänenlaadun heikentymisen huomaa parhaiten matalien bassoäänten ja korkeiden diskanttiäänten kontrastissa.

Vaikka tallennettavan ja hävitettävän informaation välinen valinta perustuu malliin ihmiskorvan kyvystä erottaa ääniä, on se silti periaatteessa ”makuasia”. Eri pakkausohjelmat eivät siis pakkaa ääntä täsmälleen samoin, vaan niillä voi olla merkittäviäkin laatueroja. MP3-tiedoston äänenlaatuun vaikuttaa lisäksi suoraan sen bittinopeus (bitrate), joka vaihtelee 32 kilobitistä sekunnissa 320 kilobittiin sekunnissa. Suurempi bittinopeus merkitsee laadukkaampaa ääntä, mutta vastaavasti suurempaa tiedostokokoa. CD:hen verrattava äänenlaatu vaatii yleisen arvion mukaan korkeampaa bittinopeutta kuin 128 kilobittiä sekunnissa.[8][9]

Pakkausalgoritmi jaetaan neljään pääosaan.[10] Ensimmäisessä vaiheessa ääni jaetaan kehyksiksi (engl. frame) kutsuttuihin osiin ja MDCT-suodatinta käytetään tulokseen. Toisessa vaiheessa ääninäyte käytetään 1024-pisteen FFT-muunnoksen läpi, käytetään psykoakustista mallia sekä tehdään toinen MDCT-suodatus. Kolmannessa vaiheessa jokainen ääninäyte arvioidaan (engl. quantify) ja koodataan, jota kutsutaan äänen varaamiseksi (engl. noise allocation). Neljäs vaihe muotoilee bittivirran (audiokehys), jossa on neljä osaa: otsikkotieto, virheentarkistus, äänitieto ja lisätieto.[10]

Psykoakustista mallia käytetään tunnistamaan äänen taajuudet, joita ihmiskorva ei kuule eli 20 hertsistä 20 kilohertsiin, ja suurin herkkyys on välillä 2–4 kilohertsiä.[11] Lisäksi kuulo heikkenee iän myötä ja ilmiö, jossa voimakkaat äänet piilottavat pehmeämpiä ääniä (engl. masking) voi vaikuttaa myös edeltävien ja seuraavien äänien havaitsemiseen.[12] Pakkauksessa käytetään bittimäärää (bitrate), joka vaikuttaa äänen laatuun ja MPEG-kerros (Layer 1–3) käyttää erilaista kompleksisuutta eri sovellustarkoituksien mukaan.[11]

Purkaminen (”soittaminen” eli toistaminen) on määritelty huolellisesti ISO-standardissa.[11] Pakkaamista ei ole määritelty standardissa ja eri pakkausohjelma voi vaikuttaa siihen miltä pakattu ääni kuulostaa.[12]

Käyttö

muokkaa

Ensimmäisen ohjelmistopohjaisen MP3-dekooderin kehitti Zagrebin yliopiston sähkötekniikan opiskelija Tomislav Uzelac professori Mario Kovačin projektissa. Uzelac julkaisi AMP MP3 Playback Enginen, jonka Justin Frankel ja Dmitry Boldyrev siirsivät Windowsille ja kehittivät Winamp-soitto-ohjelman.[13][14]

Formaatti tuli suosituksi Napsterin ja muiden vertaisverkkojen ansiosta, koska sillä voidaan pakata digitaalinen musiikki jopa kymmenesosaan sen alkuperäisestä koosta äänenlaadun kovinkaan pahasti heikkenemättä. Sitä käytetään myös artistien ja orkestereiden tuotannon julkituomisessa Internetissä sekä podcasteissa ja nettiradiossa.

Lisenssi

muokkaa

MP3:n lisenssimaksu oli 0,75 dollaria MP3:n purkuun pystyvältä tai kaksinkertainen myös pakkaukseen pystyvältä laitteelta.lähde? Lisenssimaksujen ja patenttien vuoksi useimmat suositut Linux-jakelut eivät toimittaneet lainkaan MP3-purkuun ja -pakkaukseen pystyviä ohjelmia.

Tiedostomuoto

muokkaa
 
MP3-tiedoston rakenne.

MP3-tiedosto koostuu pienemmistä osista, joita kutsutaan kehyksiksi (engl. frame). Yleisesti katsottuna osat ovat ottaen itsenäisiä ja niissä on omat otsikko-osansa ja audio. Tiedostossa itsessä ei ole otsikkoa, jolloin sen voi katkaista palasiksi ja toistaa seuraavasta otsikosta alkaen. Käytännössä sisäisen tiedon vuoksi osissa on riippuvuuksia toisiinsa. Eri osien otsikot ovat yleensä samanlaisia, paitsi kun käytetään vaihtuvaa bittimäärä (variable bitrate, VBR).[15]

Otsikkotieto on neljä tavua (32 bittiä), jossa on 11 bittiä "tahdistamiseen" käytetylle tiedolle sekä kaksi bittiä MPEG-versiolle. Tämän jälkeen on kaksi bittiä MPEG-kerroksen tunnistamiseksi ja yksi suojausbitti, joka kertoo että otsikon jälkeen tulee 16-bittinen CRC-tarkistussumma. Neljä bittiä kertoo ääneen käytetyn bittimäärän, joka riippuu MPEG-versiosta ja kerroksesta. Tämän jälkeen tulee kaksi bittiä näytteenottotaajuudelle, yksi täytebitti ja yksi yksityinen bitti sovelluksen käyttöön. Lopuksi kaksi bittiä kertoo kanavamoodin (stereo, yhdistelmästereo, kaksi monokanavaa tai yksi monokanava).[15]

Katso myös

muokkaa

Lähteet

muokkaa
  1. Lyhenneluettelo 25.4.2013. Kotimaisten kielten keskus. Arkistoitu 12.10.2013. Viitattu 24.5.2013.
  2. History of MPEG courses.ischool.berkeley.edu. Viitattu 31.7.2022. (englanniksi)
  3. MP3 (MPEG Layer III Audio Encoding) loc.gov. Viitattu 31.7.2022. (englanniksi)
  4. Developers & Manufacturers FAQ Thomson. Viitattu 16. toukokuuta 2007. (englanniksi)
  5. The Fraunhofer Society (Fraunhofer-Gesellschaft, FhG) Toukokuu 2006. Britannian suurlähetystö, Berliini. Arkistoitu 13.12.2007. Viitattu 16. toukokuuta 2007. (englanniksi)
  6. Wikimedia mp3 support
  7. Audio Compression (PDF) users.ece.utexas.edu. Viitattu 31.7.2022. (englanniksi)
  8. Gabriel Bouvigne: My listening tests 1998. Mp3-tech.org. Viitattu 16. toukokuuta 2007. (englanniksi)
  9. Sam C. Lin: MP3 vs. CD Audio Quality Tests 2001, 2005. lincomatic.com. Viitattu toukokuuta 2007. (englanniksi)
  10. a b John (Jake) Guckert: The Use of FFT and MDCT in MP3 Audio Compression (PDF) math.utah.edu. kevät 2012. Viitattu 31.7.2022. (englanniksi)
  11. a b c Praveen Sripada: MP3 DECODER in Theory and Practice (PDF) diva-portal.org. maaliskuu 2006. Viitattu 31.7.2022. (englanniksi)
  12. a b Will Ryu: Do MP3 encoders sound different? archive.arstechnica.com. Viitattu 31.7.2022. (englanniksi)
  13. Mario Kovač, Tomislav Uzelac: A Fast MPEG Audio Layer III Software Decoder. Proceedings of the IEEE Southeastcon 98, 1998, s. 27. Artikkelin verkkoversio. (englanniksi)
  14. Meet the Men Who Created the MP3 ThoughtCo. Viitattu 31.12.2022. (englanniksi)
  15. a b MPEG Audio Layer I/II/III frame header mpgedit.org. Viitattu 31.7.2022. (englanniksi)

Aiheesta muualla

muokkaa

 

  NODES
INTERN 1
USERS 1