Formatos de vídeo comparados: MP4, WebM, MOV y AVI

Publicado el 2026-04-13 9 min de lectura

Resumen (TL;DR)

Un amigo editor de vídeo me escribió el año pasado: “Es un MP4, ¿por qué no lo lee Premiere?”. La extensión decía .mp4, pero dentro había HEVC 10 bits 4:2:2 de una cámara Sony, y su toolchain esperaba H.264. El contenedor estaba bien. El códec era el problema. Esa sola confusión cubre aproximadamente el 90% de lo que realmente necesitas saber sobre formatos de vídeo, así que empiezo por ahí.

La distinción más útil en vídeo es entre el contenedor (MP4, WebM, MOV, AVI, MKV) y el códec (H.264, H.265/HEVC, AV1, VP9, ProRes). Los contenedores son el embalaje; los códecs son el algoritmo de compresión dentro. La guía práctica se desprende de esa división. Para la web abierta, MP4 con H.264 sigue siendo el valor por defecto más seguro. Cuando el ancho de banda importa y puedes permitirte una codificación más larga, AV1 o H.265 dentro de MP4 o WebM entregan archivos sustancialmente más pequeños con la misma calidad. Para masters de edición, MOV con ProRes es el estándar de largo plazo. Para archivado a largo plazo, MKV con AV1 o H.265 es una elección sólida gracias a la flexibilidad de MKV con múltiples pistas de audio, subtítulos y capítulos. AVI no es “alta calidad por defecto”: es simplemente un contenedor más antiguo con soporte limitado para metadatos y subtítulos modernos. H.265 es aproximadamente 40–50% más eficiente que H.264 con la misma calidad, pero viene con advertencias de licenciamiento y dispositivos antiguos; AV1 es libre de regalías pero todavía escaso en codificadores de hardware en 2025.

Antecedentes y conceptos

Un contenedor aloja vídeo, audio, subtítulos, capítulos y metadatos en un único archivo. MP4 se basa en el ISO Base Media File Format, WebM es un subconjunto de Matroska enfocado a la web, MOV es el contenedor QuickTime de Apple, AVI se remonta a 1992 y refleja su época, y MKV (Matroska) es extensible y agnóstico al códec.

Un códec es el algoritmo que realmente comprime píxeles. H.264 (AVC) ha sido el estándar web de facto desde su estandarización en 2003 y decodifica en hardware casi en todas partes. H.265 (HEVC) consigue calidad comparable a aproximadamente la mitad de bitrate, pero está sujeto a licenciamiento por pool de patentes y soporte de hardware menos universal en dispositivos antiguos. AV1, lanzado en 2018 por la Alliance for Open Media, apunta a eficiencia a nivel HEVC o mejor sin regalías. VP9 se usa ampliamente en WebM y YouTube. ProRes es el códec de edición de Apple, diseñado para decodificación rápida fotograma a fotograma durante la edición a costa de la compresión; los editores lo eligen precisamente porque sus archivos son grandes y el scrubbing es rápido. Así que la calidad no es una propiedad del contenedor: está determinada por el códec, el bitrate y los ajustes del codificador.

En la práctica aparecen otros dos conceptos. El control de bitrate define si el codificador apunta a un bitrate constante (CBR) para streaming predecible, un bitrate promedio (ABR) o un objetivo de calidad constante (CRF, Constant Rate Factor). Para entrega bajo demanda, CRF normalmente produce mejor calidad con menor tamaño promedio porque el codificador gasta bits donde hacen falta y planea por escenas fáciles. La estructura GOP —el patrón de fotogramas intra (I), predichos (P) y bidireccionales (B)— controla tanto la eficiencia de compresión como la rapidez con que un espectador puede buscar dentro del vídeo. Un GOP más corto (más fotogramas I) es más amigable al scrubbing; un GOP más largo comprime mejor. Las pipelines de streaming a menudo escogen longitudes GOP alineadas con los límites de segmento (por ejemplo, cada 2 segundos) para que el cambio ABR sea limpio.

Comparación y datos

ContenedorCódecs típicosReproducción en navegadorMetadatos y subtítulosEficiencia de compresiónNotas
MP4H.264, H.265, AV1Universal vía H.264Amplia (ID3, capítulos)Depende del códecValor por defecto para entrega web
WebMVP9, AV1Chrome, Firefox, Edge, Safari modernosSubtítulos WebVTTFuerte con AV1Abierto y libre de regalías
MOVH.264, ProRes, etc.Reproducción web directa limitadaModelo de pistas muy ricoAmigable para ediciónNativo en macOS e iOS
AVIXvid, DivX, legacyPobre en navegadores modernosLimitadaAntiguo e ineficienteCompatibilidad legacy
MKVPrácticamente cualquier códecReproducción web directa limitadaExtremadamente flexibleDepende del códecComún para archivado

Cifras como “50% más eficiente” son promedios aproximados con calidad emparejada. Los resultados reales dependen fuertemente del contenido, el bitrate, el preset y el codificador. No compares bitrates entre códecs sin antes emparejar el objetivo de calidad.

Escenarios reales

Escenario 1 — Distribuir vídeo en un sitio público. El valor por defecto más seguro es MP4 con H.264 High Profile y audio AAC-LC. Para una introducción de producto de 90 segundos en una landing, uso rutinariamente ffmpeg -c:v libx264 -crf 23 -preset slow -c:a aac -b:a 128k, que aterriza alrededor de 8 MB a 1080p y se ve limpio. Si quieres ahorrar ancho de banda y tu audiencia usa navegadores recientes, añade una fuente WebM con AV1 o VP9 y deja que el elemento <video> elija la mejor disponible. Los subtítulos deben ir en una pista WebVTT aparte para accesibilidad y descubribilidad.

Escenario 2 — Preservar un master de edición. Las líneas de tiempo de edición se benefician de formatos ligeramente comprimidos como MOV con ProRes 422. Una vez intenté cortar directamente desde una fuente HEVC en DaVinci Resolve y vi la timeline tartamudear en cada corte; transcodificar a proxies ProRes 422 hizo que el mismo proyecto reprodujera en tiempo real en la misma máquina. Los archivos son grandes —calcula unos 8 GB para 10 minutos de 1080p— pero el scrubbing y el corte se mantienen ágiles porque decodificar cada fotograma es barato. Tras editar, reencode una sola vez a un formato de entrega como H.264 o H.265; no edites contra un códec de entrega.

Escenario 3 — Archivado a largo plazo. Para guardar masters terminados durante años, MKV con AV1 es un valor por defecto moderno razonable. He estado reencodeando masters 4K antiguos con SvtAv1EncApp --preset 4 --crf 28 y aterrizando en 40–55% del original H.264 sin pérdida visible en un monitor calibrado. AV1 es libre de regalías, su eficiencia de compresión es fuerte, y MKV permite mantener múltiples pistas de audio y subtítulos más capítulos en un solo archivo. Usa codificación basada en CRF con bitrate generoso para evitar pérdidas visibles en la copia archivada.

Escenario 4 — Streaming adaptativo para una audiencia grande. Para entrega en vivo o bajo demanda a escala, la cuestión del contenedor queda parcialmente reemplazada por la del contenedor de streaming: segmentos fMP4 para HLS o DASH suelen llevar H.264 y H.265, mientras que los segmentos WebM llevan VP9 o AV1. La propiedad importante no es la extensión, sino que los segmentos se alineen con los límites IDR/I-frame para que los reproductores ABR puedan cambiar de bitrate limpiamente. La mayoría del debate “¿qué contenedor?” se vuelve irrelevante aquí, porque tu CDN y empaquetador deciden el formato en cable.

Errores comunes

“AVI siempre es alta calidad.” AVI es solo un contenedor antiguo; la calidad la fijan el códec y el bitrate internos. El mismo códec en MP4 o MKV entrega calidad efectivamente idéntica con mejor soporte de subtítulos y metadatos.

“MOV es solo de Apple.” MOV nació en QuickTime, pero está ampliamente soportado en reproductores de Windows y Linux. La reproducción directa en navegador es el eslabón débil; para entrega web, reempaqueta en MP4.

“H.265 siempre es mejor que H.264.” Es más eficiente, pero los costes de licenciamiento y el soporte de hardware desigual en dispositivos antiguos hacen de H.264 el valor por defecto más seguro para audiencias públicas heterogéneas.

“AV1 es el nuevo estándar.” El impulso es real —Intel Arc, la línea M3 de Apple y las tarjetas NVIDIA RTX serie 40 traen codificadores AV1 por hardware— pero a principios de 2026 la mayoría de pipelines de live streaming en producción aún corren H.264 o H.265 porque la codificación AV1 en tiempo real es costosa en energía, calor y licenciamiento de codificadores fiables. AV1 es excelente para codificación por lotes y archivado, menos para ingesta en vivo a escala.

“Más resolución se ve automáticamente mejor.” Solo si la fuente y la pantalla la soportan. 4K a bitrate bajo puede verse peor que 1080p a bitrate más alto porque el codificador se queda sin bits para describir los píxeles extra. Para entrega web, piensa en términos de bitrate objetivo por resolución en vez de resolución sola.

“La extensión me dice la calidad.” Un archivo .mp4 podría contener H.264 a 1 Mbps o H.265 a 20 Mbps; la extensión no dice nada sobre el contenido. Usa una herramienta como ffprobe o MediaInfo para inspeccionar el códec real, el bitrate, la resolución y la tasa de fotogramas antes de decidir.

Lista de verificación

  1. ¿Cuál es el propósito final?
    • Entrega web pública: fallback MP4 + H.264; añade AV1 cuando sea práctico.
    • Reproductor interno o específico: comprueba primero la lista de códecs de ese reproductor.
    • Master de edición: MOV + ProRes o equivalente.
    • Archivo a largo plazo: MKV + AV1 o H.265.
  2. ¿Qué dispositivos y navegadores usa tu audiencia? Un fuerte sesgo hacia hardware antiguo obliga a mantener un fallback H.264.
  3. ¿Prioridad de tamaño o calidad? Tamaño primero: AV1 o H.265. Compatibilidad primero: H.264.
  4. ¿Qué tan importantes son varias pistas de audio, subtítulos y capítulos? Si es crítico, favorece MKV o MP4 con estructura de pistas adecuada.
  5. ¿Cuál es el perfil de costes? Presupuesta licenciamiento H.265 cuando aplique, y contabiliza tiempo y energía de codificación AV1.
  6. ¿Editarás de nuevo más adelante? Mantén un master de grado de edición (MOV + ProRes o equivalente) junto al encode de entrega, para no tener que re-derivar calidad desde un archivo ya con pérdida cuando llegue la próxima revisión.

Una nota práctica más: el audio suele importar más de lo que los creadores esperan. Los oyentes perdonan artefactos de compresión en vídeo mucho más fácilmente que audio recortado o mal codificado. Para entrega web, AAC a 128 kbps estéreo es un piso sensato; para contenido cargado de música, 192–256 kbps o Opus (en WebM) producirán resultados notablemente mejores a bitrates similares. Emparejar la tasa de muestreo (normalmente 48 kHz para vídeo) entre tus assets evita artefactos de remuestreo durante la edición.

Herramienta relacionada

Las conversiones reales para los escenarios de arriba pueden probarse en el conversor de vídeo de Patrache Studio. Las miniaturas, pósteres y stills de apertura que acompañen a tus vídeos deberían seguir las reglas de formato de la Guía de compresión de imágenes para mantener bajo el peso total de la página. Si planeas superponer un código QR escaneable sobre el vídeo o su packaging, la guía Seguridad de códigos QR explica los compromisos entre QR estático y dinámico antes de imprimir o publicar.

Referencias