Im wesentlichen besteht eine MP3-Datei aus einem Header und einem Datenteil. Der Datenteil besteht wiederum aus sogenannten Frames, die die Audiodaten beinhalten. Jeder dieser Frames enthält, wie auch die Datei selber einen Header, der üblicherweise gleich dem Main-Header ist. Dieser Frameheader wird hauptsächlich zur Synchronisation benutzt.
4.1. Der Header
Der Header jeder MP3-Datei besteht aus 32 Bit. Dieser Header bildet auch den Anfang jedes Frames.
AAAAAAAA AAAABCCD EEEEFFGH IIJJKLMM
Bits Werte Beschreibung
A 12 Immer 0xFFF Synchronisationsdaten
B 1 1 = mpeg 1.0, 0 = mpeg 2.0 Mpeg Version, ID
C 2 4-layer = Layer I,II oder III Layer
D 1 0 = ja, 1 = nein Fehlerschutz
E 4 Bitrate
F 2 Sampling Frequenz
G 1 Padding
H 1 Erweiterung
I 2 Audiomodus
J 2 Benutzt mit "joint stereo" Erweiterter Modus
K 1 0 = nein, 1 = ja Copyrightbit
L 1 0 = nein, 1 = ja Originalbit
M 2 Emphasis
4.1.1. Bitrate
Die Bitrate ist die Datenmenge, die eine Sekunde Musik benötigt. Diese wird in KiloBit pro Sekunde (kBps, kBit) angegeben. Diese Datenmenge ist je nach Art der Komprimierung unterschiedlich.
Mpeg 1.0:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Layer 1 32 64 96 128 160 192 224 256 288 320 352 384 416 448
Layer 2 32 48 56 64 80 96 112 128 160 192 224 256 320 384
Layer 3 32 40 48 56 64 80 96 112 128 160 192 224 256 320
Mpeg 2.0:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Layer 1 32 48 56 64 80 96 112 128 144 160 176 192 224 256
Layer 2 8 16 24 32 40 48 56 64 80 96 112 128 144 160
Layer 3 8 16 24 32 40 48 56 64 80 96 112 128 144 160
4.1.2. Samplingfrequenz
Die Samplingfrequenz wird in Herz (Hz) angegeben. Sie gibt an, wie oft die Soundkarte pro Sekunde Daten erhält.
0 1 2
Mpeg 1.0 44100 48000 32000
Mpeg 2.0 22050 24000 160000
4.1.3. Audiomodus
Eine Sounddatei besteht aus ein oder mehreren Kanälen, normalerweise einem oder zwei. Ein Stereo- bzw. ein JointStereo-Signal besteht aus 2 Kanälen, einer für links und einer für rechts. Damit kann ein räumliche wirkender Klang erzeugt werden. Bei Dualchannel sind beide Kanäle identisch. Dieser Modus wird dann verwendet, wenn aus einem Mono ein ein "Pseudostereo" Signal erzeugt wird. Singelchannel, oder auch Mono, besteht aus einem einzigen Kanal. Damit kann kein räumlicher Klang erzeugt werden.
0 1 2 3
Stereo joint stereo dualchannel singlechannel (mono)
4.1.4. Erweiterter Modus:
intensive stereo MS Stereo interne Bezeichnung
0 aus aus MPG_MD_LR_LR
1 aus ein MPG_MD_LR_I
2 ein aus MPG_MD_MS_LR
3 ein ein MPG_MD_MS_I
4.1.5. jsbound:
Layer | erw. Modus 0 1 2 3
1 4 8 12 16
2 4 8 12 16
3 0 4 8 16
4.1.6. Emphasis:
0 1 2 3
Keine 50/15 Mikrosekunden reserviert CCITT J 17
4.1.7. Berechnung der Framelänge
Bei Mpeg 1.0:
Layer 1: (48000*bitrate)/samplingfrequenz + padding
Layer 2&3: (144000*bitrate)/samplingfrequenz + padding
Bei Mpeg 2.0:
Layer 1: (24000*bitrate)/samplingfrequenz + padding
Layer 2&3: (72000*bitrate)/samplingfrequenz + padding
|