Videoformate im Vergleich: MP4, WebM, MOV, AVI
Zusammenfassung (TL;DR)
Ein befreundeter Video-Editor schrieb mir letztes Jahr: „Es ist ein MP4, warum will Premiere das nicht lesen?” Die Endung lautete .mp4, drin steckte aber HEVC 10-Bit 4:2:2 aus einer Sony-Kamera – und seine Toolchain erwartete H.264. Der Container war in Ordnung. Das Codec war das Problem. Diese eine Verwechslung deckt rund 90 % dessen ab, was du zu Videoformaten tatsächlich wissen musst, also fange ich damit an.
Die mit Abstand nützlichste Unterscheidung bei Video ist die zwischen Container (MP4, WebM, MOV, AVI, MKV) und Codec (H.264, H.265/HEVC, AV1, VP9, ProRes). Container sind die Verpackung; Codecs sind der Kompressionsalgorithmus im Inneren. Aus dieser Trennung folgt die praktische Empfehlung. Fürs offene Web ist MP4 mit H.264 weiterhin der sicherste Standard. Wenn Bandbreite zählt und du ein längeres Encoding in Kauf nehmen kannst, liefern AV1 oder H.265 in MP4 oder WebM bei gleicher Qualität deutlich kleinere Dateien. Für Editing-Master ist MOV mit ProRes seit Langem der Standard. Für die Langzeitarchivierung ist MKV mit AV1 oder H.265 dank der Flexibilität von MKV mit mehreren Audio-, Untertitel- und Kapitelspuren eine starke Wahl. AVI ist nicht „von Natur aus hochqualitativ” – es ist einfach ein älterer Container mit eingeschränkter Unterstützung moderner Metadaten und Untertitel. H.265 ist bei gleicher Qualität rund 40–50 % effizienter als H.264, bringt aber Lizenz- und Altgeräte-Einschränkungen mit; AV1 ist lizenzfrei, 2025 aber immer noch dünn besiedelt bei Hardware-Encodern.
Hintergrund und Konzepte
Ein Container bündelt Video, Audio, Untertitel, Kapitel und Metadaten in einer einzigen Datei. MP4 basiert auf dem ISO Base Media File Format, WebM ist eine webfokussierte Matroska-Teilmenge, MOV ist Apples QuickTime-Container, AVI stammt aus dem Jahr 1992 und trägt die Spuren seiner Ära, und MKV (Matroska) ist erweiterbar und codec-agnostisch.
Ein Codec ist der Algorithmus, der tatsächlich die Pixel komprimiert. H.264 (AVC) ist seit der Standardisierung 2003 der De-facto-Webstandard und wird fast überall in Hardware dekodiert. H.265 (HEVC) erreicht vergleichbare Qualität bei rund halber Bitrate, unterliegt aber Patentpool-Lizenzierung und hat auf älteren Geräten weniger universelle Hardware-Unterstützung. AV1 wurde 2018 von der Alliance for Open Media veröffentlicht und zielt auf HEVC-Niveau oder besser – ohne Lizenzgebühren. VP9 ist weit verbreitet in WebM und YouTube. ProRes ist Apples Editing-Codec, auf schnelles Frame-Level-Decoding während des Schnitts ausgelegt, bezahlt mit großen Dateien; Editor:innen wählen es gerade, weil seine Dateien groß sind und das Scrubbing rasch läuft. Qualität ist also keine Eigenschaft des Containers – sie wird vom Codec, der Bitrate und den Encoder-Einstellungen bestimmt.
Zwei weitere Konzepte begegnen dir in der Praxis. Die Bitratensteuerung legt fest, ob der Encoder eine konstante Bitrate (CBR) für vorhersagbares Streaming, eine durchschnittliche Bitrate (ABR) oder ein konstantes Qualitätsziel (CRF, Constant Rate Factor) ansteuert. Für On-Demand-Auslieferung liefert CRF meist bessere Qualität bei kleinerer durchschnittlicher Dateigröße, weil der Encoder Bits dort ausgibt, wo sie gebraucht werden, und einfache Szenen im Leerlauf durchläuft. Die GOP-Struktur – das Muster aus Intra- (I-), Predicted- (P-) und Bidirectional- (B-)Frames – steuert sowohl die Komprimierungseffizienz als auch, wie schnell Zuschauer:innen in das Video springen können. Eine engere GOP (mehr I-Frames) ist scrubbingfreundlich; eine lockerere GOP komprimiert besser. Streaming-Pipelines wählen GOP-Längen häufig an Segmentgrenzen orientiert (etwa alle 2 Sekunden), damit ABR-Switching nahtlos funktioniert.
Vergleich und Daten
| Container | Typische Codecs | Browserwiedergabe | Metadaten und Untertitel | Komprimierungseffizienz | Anmerkungen |
|---|---|---|---|---|---|
| MP4 | H.264, H.265, AV1 | Universell via H.264 | Umfassend (ID3, Kapitel) | Codec-abhängig | Standard für Webauslieferung |
| WebM | VP9, AV1 | Moderne Chrome, Firefox, Edge, Safari | WebVTT-Untertitel | Stark mit AV1 | Offen und lizenzfrei |
| MOV | H.264, ProRes u. a. | Direkt im Web eingeschränkt | Sehr reichhaltiges Spurenmodell | Editing-freundlich | macOS- und iOS-nativ |
| AVI | Xvid, DivX, Legacy | Schlecht in modernen Browsern | Begrenzt | Älter und ineffizient | Legacy-Kompatibilität |
| MKV | Praktisch jeder Codec | Direkt im Web eingeschränkt | Extrem flexibel | Codec-abhängig | Beliebt fürs Archiv |
Zahlen wie „50 % effizienter” sind grobe Durchschnitte bei abgestimmter Qualität. Reale Ergebnisse hängen stark von Inhalt, Bitrate, Preset und Encoder ab. Vergleiche keine Bitraten zwischen Codecs, ohne zuerst das Qualitätsziel anzugleichen.
Praxisszenarien
Szenario 1 – Video auf einer öffentlichen Website verteilen. Der sicherste Standard ist MP4 mit H.264 High Profile und AAC-LC-Audio. Für ein 90-sekündiges Produktintro auf einer Landingpage verwende ich routinemäßig ffmpeg -c:v libx264 -crf 23 -preset slow -c:a aac -b:a 128k, was bei 1080p bei rund 8 MB landet und sauber aussieht. Willst du Bandbreite sparen und nutzt dein Publikum aktuelle Browser, ergänze eine WebM-Quelle mit AV1 oder VP9 und lass das <video>-Element die beste verfügbare wählen. Untertitel gehören in eine eigene WebVTT-Spur für Barrierefreiheit und Auffindbarkeit.
Szenario 2 – Einen Editing-Master erhalten. Schnitt-Timelines profitieren von schwach komprimierten Formaten wie MOV mit ProRes 422. Ich habe einmal versucht, direkt aus einer HEVC-Quelle in DaVinci Resolve zu schneiden, und sah die Timeline an jedem Schnitt stottern; nach Transkodierung zu ProRes-422-Proxys lief dasselbe Projekt auf derselben Maschine in Echtzeit. Die Dateien sind groß – rechne mit etwa 8 GB für 10 Minuten 1080p – aber Scrubbing und Schneiden bleiben flott, weil das Decoding jedes Frames billig ist. Nach dem Schnitt einmalig in ein Auslieferungsformat wie H.264 oder H.265 re-encodieren – niemals gegen einen Delivery-Codec schneiden.
Szenario 3 – Langzeitarchivierung. Um fertige Master jahrelang zu speichern, ist MKV mit AV1 ein vernünftiger moderner Standard. Ich re-encodiere alte 4K-Master mit SvtAv1EncApp --preset 4 --crf 28 und lande bei 40–55 % der H.264-Originalgröße ohne sichtbaren Verlust auf einem kalibrierten Display. AV1 ist lizenzfrei, seine Komprimierungseffizienz ist stark, und MKV erlaubt es, mehrere Audio- und Untertitelspuren samt Kapiteln in einer Datei zu halten. Nutze CRF-basiertes Encoding mit großzügiger Bitrate, um sichtbaren Verlust auf der archivierten Kopie zu vermeiden.
Szenario 4 – Adaptives Streaming für ein großes Publikum. Für Live- oder On-Demand-Auslieferung in großer Skala wird die Containerfrage teils durch die Streaming-Containerfrage ersetzt: fMP4-Segmente für HLS oder DASH tragen meist H.264 und H.265, während WebM-Segmente VP9 oder AV1 tragen. Die entscheidende Eigenschaft ist nicht die Endung, sondern ob die Segmente an IDR-/I-Frame-Grenzen ausgerichtet sind, damit ABR-Player Bitraten sauber wechseln können. Ein Großteil der „Welcher Container?”-Debatte wird hier hinfällig, weil CDN und Packager das tatsächliche Over-the-Wire-Format bestimmen.
Häufige Missverständnisse
„AVI ist immer hochqualitativ.” AVI ist nur ein alter Container; die Qualität entsteht im Inneren durch Codec und Bitrate. Derselbe Codec in MP4 oder MKV liefert praktisch identische Qualität bei besserer Unterstützung von Untertiteln und Metadaten.
„MOV ist Apple-only.” MOV stammt aus QuickTime, wird aber in Playern auf Windows und Linux breit unterstützt. Die schwächere Stelle ist die direkte Browserwiedergabe; fürs Web neu in MP4 verpacken.
„H.265 ist immer besser als H.264.” Es ist effizienter, doch Lizenzkosten und ungleichmäßige Hardware-Unterstützung auf älteren Geräten machen H.264 zum sichereren Standard für heterogene öffentliche Zielgruppen.
„AV1 ist der neue Standard.” Die Dynamik ist real – Intel Arc, Apples M3-Reihe und NVIDIA-RTX-40-Karten liefern alle AV1-Hardware-Encoder – doch Anfang 2026 fahren die meisten Produktions-Live-Streaming-Pipelines weiterhin H.264 oder H.265, weil Echtzeit-AV1-Encoding teuer in Leistung, Wärme und der Lizenzierung zuverlässiger Encoder ist. AV1 ist exzellent fürs Batch-Encoding und Archiv, weniger für Live-Ingestion in großer Skala.
„Höhere Auflösung sieht automatisch besser aus.” Nur, wenn Quelle und Display sie beide unterstützen. 4K mit niedriger Bitrate kann schlechter aussehen als 1080p mit höherer Bitrate, weil dem Encoder die Bits ausgehen, um die zusätzlichen Pixel zu beschreiben. Für Webauslieferung denke in Zielbitrate pro Auflösung statt nur in Auflösung.
„Die Endung verrät mir die Qualität.” Eine .mp4-Datei könnte H.264 bei 1 Mbps oder H.265 bei 20 Mbps enthalten; die Endung sagt nichts über den Inhalt. Nutze ein Tool wie ffprobe oder MediaInfo, um tatsächlichen Codec, Bitrate, Auflösung und Framerate zu prüfen, bevor du entscheidest.
Checkliste
- Was ist der Endzweck?
- Öffentliche Webauslieferung: MP4 + H.264-Fallback; AV1 ergänzen, wenn praktikabel.
- Interner oder spezifischer Player: Codec-Liste dieses Players zuerst prüfen.
- Editing-Master: MOV + ProRes oder Äquivalent.
- Langzeitarchiv: MKV + AV1 oder H.265.
- Welche Geräte und Browser nutzt dein Publikum? Starke Neigung zu älterer Hardware bedeutet, einen H.264-Fallback zwingend vorzuhalten.
- Hat Dateigröße oder Qualität Priorität? Größe zuerst: AV1 oder H.265. Kompatibilität zuerst: H.264.
- Wie wichtig sind mehrere Audio-Spuren, Untertitel und Kapitel? Wenn kritisch, MKV oder MP4 mit sauberer Spurstruktur bevorzugen.
- Wie sieht das Kostenprofil aus? Budget für H.265-Lizenzierung einplanen, wo zutreffend, und AV1-Encoding-Zeit sowie -Energie berücksichtigen.
- Wirst du später erneut schneiden? Halte einen Editing-Master (MOV + ProRes oder Äquivalent) parallel zum Delivery-Encode, damit du die Qualität für die nächste Überarbeitung nicht aus einer bereits verlustbehafteten Datei zurückgewinnen musst.
Noch eine praktische Anmerkung: Audio ist meist wichtiger, als Creator:innen erwarten. Hörer:innen verzeihen Kompressionsartefakte im Video weitaus leichter als geclipptes oder schlecht kodiertes Audio. Für Webauslieferung ist AAC bei 128 kbps Stereo eine vernünftige Untergrenze; bei musiklastigen Inhalten liefern 192–256 kbps oder Opus (in WebM) bei ähnlichen Bitraten spürbar bessere Ergebnisse. Eine einheitliche Samplerate (meist 48 kHz bei Video) über deine Assets hinweg vermeidet Resampling-Artefakte beim Schnitt.
Verwandtes Tool
Echte Konvertierungen für die obigen Szenarien kannst du im Patrache-Studio-Videokonverter ausprobieren. Thumbnails, Poster und Opening-Stills rund ums Video sollten den Formatregeln aus dem Leitfaden zur Bildkomprimierung folgen, um das Gesamtgewicht der Seite niedrig zu halten. Planst du, einen scannbaren QR-Code aufs Video oder seine Verpackung zu legen, erklärt der Leitfaden zur QR-Code-Sicherheit die Trade-offs zwischen statischem und dynamischem Code, bevor du druckst oder veröffentlichst.
Quellen
- MDN, „Video codecs” — https://developer.mozilla.org/en-US/docs/Web/Media/Formats/Video_codecs
- AOMedia, „AV1 Features” — https://aomedia.org/av1-features/get-started/
- Apple, „About Apple ProRes” — https://support.apple.com/en-us/102205
- ISO/IEC 14496-14:2020 (MP4-Dateiformat) — Standard über ISO bezogen.