Esta página foi traduzida pela API Cloud Translation.

Noções básicas de streaming de mídia

Derek Herman

Jaroslav Polakovič

Neste artigo, você vai aprender sobre o conceito mais avançado de streaming de mídia e, ao final, terá uma boa compreensão dos vários casos de uso, protocolos e extensões de streaming. Vamos começar com uma explicação sobre o que é o streaming.

O streaming de mídia é uma maneira de entregar e reproduzir conteúdo de mídia por partes. Em vez de carregar um único arquivo, que pode ser lento se não for otimizado para a rede, o player lê um arquivo de manifesto que descreve como a mídia de destino é dividida em partes individuais de dados. Os pedaços de mídia são unidos dinamicamente no momento da execução, provavelmente com diferentes taxas de bits, que você vai aprender mais tarde.

Para fornecer streaming no seu site, o servidor precisa oferecer suporte ao cabeçalho de solicitação HTTP Range. Saiba mais sobre o cabeçalho Accept-Ranges no artigo As tags <video> e <source>.

Casos de uso de streaming

Produzir blocos de mídia e os manifestos necessários que descrevem o stream não é exatamente simples, mas o streaming desbloqueia alguns casos de uso interessantes que não são possíveis apenas apontando um elemento <video> para um conjunto de arquivos de origem estáticos. Você vai aprender mais sobre como adicionar mídia a uma página da Web em uma seção mais adiante. Primeiro, você precisa conhecer alguns casos de uso de streaming de multimídia se quiser ir além do carregamento de vários arquivos no elemento <video>.

O streaming adaptável é quando os blocos de mídia são codificados em vários bitrates, e o bloco de mídia de maior qualidade que se encaixa na largura de banda disponível do cliente é retornado ao player de mídia.
A transmissão ao vivo é onde os fragmentos de mídia são codificados e disponibilizados em tempo real.
A injeção de mídia é quando outras mídias, como anúncios, são injetadas em um stream sem que o player precise mudar a origem da mídia.

Protocolos de streaming

Os dois protocolos de streaming mais usados na Web são o Dynamic Adaptive Streaming over HTTP (DASH) e o HTTP Live Streaming (HLS). Os players que oferecem suporte a esses protocolos vão buscar o arquivo de manifesto gerado, descobrir quais partes de mídia devem ser solicitadas e, em seguida, combiná-las na experiência final de mídia.

Como usar `<video>` para reproduzir um stream

Muitos navegadores não vão reproduzir sua transmissão de forma nativa. Embora haja algum suporte nativo para reprodução HLS, os navegadores geralmente não oferecem suporte à reprodução de streaming DASH nativa. Isso significa que, muitas vezes, não basta apontar o <source> no elemento <video> para um arquivo de manifesto.

<video controls>
  <source src="manifest.mpd" type="application/dash+xml">
</video>

Atenção : esse é um HTML válido, mas não funciona. Os navegadores não oferecem suporte nativo à reprodução de manifestos DASH adicionados à propriedade src.

O que pode parecer um déficit é, na verdade, uma força disfarçada. Os streams são poderosos, e os aplicativos que consomem streams têm necessidades diferentes.

Os arquivos de manifesto geralmente descrevem muitas variantes de uma única mídia. Pense em diferentes taxas de bits, várias faixas de áudio e até mesmo a mesma mídia codificada em diferentes formatos.

Alguns aplicativos podem querer manter uma quantidade maior de vídeo no buffer, outros podem querer fazer preempção dos primeiros segundos de vídeo de um próximo episódio, e alguns podem querer implementar a própria lógica para streaming adaptável. É aqui que você gostaria de ter algum recurso integrado do navegador para gerar streams de mídia para reprodução, e por acaso existe um.

Extensões de origem de mídia

Felizmente, o W3C definiu algo chamado Extensões de origem de mídia (MSE) que permite que o JavaScript gere nossos streams de mídia. Em resumo, o MSE permite que os desenvolvedores conectem um objeto MediaSource a um elemento <video> e reproduzam todos os dados de mídia que são enviados para os buffers conectados à instância MediaSource.

Exemplo básico

const videoEl = document.querySelector('video');
const mediaSource = new MediaSource();

video.src = URL.createObjectURL(mediaSource);
mediaSource.addEventListener(
  'sourceopen',
  () => {
    const mimeString = 'video/mp4; codecs="avc1.42E01E, mp4a.40.2"';
    const buffer = mediaSource.addSourceBuffer(mimeString);

    buffer.appendBuffer( /* Video data as `ArrayBuffer` object. */ )
  }
);

O exemplo simplificado acima ilustra algumas coisas:

No caso de <video>, ele recebe dados de mídia de um URL.
O URL gerado é apenas um ponteiro para uma instância de MediaSource.
A instância MediaSource cria uma ou mais instâncias SourceBuffer.
Em seguida, basta anexar dados de mídia binários ao buffer, por exemplo, usando fetch.

Embora esses conceitos básicos sejam simples, e seja certamente possível escrever um player de vídeo compatível com DASH e HLS do zero, a maioria das pessoas geralmente escolhe uma das soluções de código aberto maduras que já existem, como Shaka Player, JW Player ou Video.js, para citar algumas.

No entanto, criamos um PWA de mídia de demonstração chamado Kino que demonstra como desenvolver seu próprio site de mídia de streaming básico que ofereça reprodução de mídia off-line usando apenas o elemento <video> simples. Há planos no nosso roteiro para oferecer suporte a frameworks e gerenciamento de direitos digitais, entre outros recursos. Por isso, confira as atualizações de tempos em tempos ou solicite um recurso. Leia mais sobre isso no artigo PWA com streaming off-line.

Formato dos pedaços de mídia

Por muito tempo, o DASH e o HLS exigiam que os blocos de mídia fossem codificados em formatos diferentes. No entanto, em 2016, o suporte a arquivos MP4 fragmentado (fMP4) padrão foi adicionado ao HLS, um formato que o DASH também oferece suporte.

Os fragmentos de vídeo que usam o contêiner fMP4 e o codec H.264 têm suporte a ambos os protocolos e podem ser reproduzidos pela grande maioria dos players. Isso permite que os produtores de conteúdo codifiquem os vídeos apenas uma vez, o que economizar tempo e espaço no disco.

Para alcançar uma qualidade melhor e tamanhos de arquivo menores, você pode codificar vários conjuntos de fragmentos de mídia usando formatos mais eficientes, como VP9. No entanto, antes de avançarmos, você precisa aprender a Preparar arquivos de mídia para a Web, que é o próximo assunto.

Noções básicas de streaming de mídia

Casos de uso de streaming

Protocolos de streaming

Como usar <video> para reproduzir um stream

Extensões de origem de mídia

Exemplo básico

Formato dos pedaços de mídia

Como usar `<video>` para reproduzir um stream