Das Format ist in Chunks unterteilt. Der allgemeine Aufbau sieht wie folgt aus:
RIFF-Header
Format-Chunk
Data-Chunk

Jeder Chunk wird durch eine 4 byte Kennung eingeleitet. Danach kommen 4 byte mit der Länge des Chunks. Dann kommen die Parameter. Da alle Daten wortweise abgelegt werden, mus eine ungerade Anzahl von Daten mit Nullbytes aufgefüllt werden. Das Füllbyte wird in der Längenangabe aber nicht berücksichtigt. Alle Daten sind im Intel Format (little endian) gespeichert.

WAV-Header
Offset Bytes Bemerkungen
00h 4 Chunk-Name 'RIFF'
04h 4 Chunk-Länge
08h 4 RIFF-Type 'WAVE'

FMT-Chunk
Offset Bytes Bemerkungen
00h 4 Chunk-Name 'FMT'
04h 4 Chunk-Länge (10h)
08h 2 Format-Typ
  • 0 = Mono
  • 1 = Stereo
0Ah 2 Kanalzahl
0Ch 4 Sample Rate (in Hertz)
10h 4 Byte pro Sekunde
14h 2 Bytes pro Sample
  • 1 = 8bit Mono
  • 2 = 8bit Stereo oder 16bit Mono
  • 4 = 16bit Stereo
16h 2 Bits per Sample

Data-Chunk
Offset Bytes Bemerkungen
00h 4 Chunk-Name 'data'
04h 4 Chunk-Länge
08h n Daten