Fundamentos de aplicativos de mídia

Derek Herman
Derek Herman
Joe Medley
Joe Medley

Trabalhar com mídia geralmente exige a mudança das características dos arquivos de mídia, como taxa de bits ou resolução. Encontrar uma maneira simples de começar pode ser bastante intimidante. Nesta página, você aprenderá sobre as ferramentas usadas e como instalá-las rapidamente.

Primeiro, descrevemos o uso básico de dois utilitários comuns de mídia de linha de comando: Shaka Packager e FFmpeg. Depois, vamos ajudar você a instalar as ferramentas rapidamente. Por que abordar duas inscrições? Embora ambos sejam poderosos e úteis por si só, nenhum deles faz tudo o que é necessário para preparar a mídia para a Web. Também criamos as páginas Conversão de mídia e Criptografia de mídia, que mostram muitas operações mais comuns com esses dois aplicativos.

Esses aplicativos não são as únicas opções disponíveis para tarefas de manipulação de arquivos, mas são as duas mais comuns e poderosas. Outras opções incluem os aplicativos de GUI Miro, HandBrake e VLC (links em inglês). Há também serviços de codificação/transcodificação, como Zencoder, Amazon Elastic Encoder e API Google Transcoder.

Empacotador Shaka

O Shaka Packager é um SDK de empacotamento de mídia sem custo financeiro. Se você usar um player de mídia no seu site, use o Shaka Packager para preparar os arquivos. Ele oferece suporte à conversão para os dois protocolos de streaming de vídeo mais comuns: Dynamic Adaptive Streaming over HTTP (DASH) ou HTTP Live Streaming (HLS). O Shaka Packager oferece suporte aos principais recursos de segurança: criptografia comum e gerenciamento de direitos digitais (DRM, na sigla em inglês) da Widevine. Ele também pode lidar com streaming ao vivo e vídeo sob demanda.

Apesar do que diz no pacote, esse utilitário é para mais que desenvolvedores de C++. Você pode usá-lo tanto como uma biblioteca para criar software de mídia quanto como um utilitário de linha de comando para preparar arquivos de mídia para reprodução na Web. Essa capacidade é útil para nós aqui. Na verdade, para criadores de conteúdo de mídia da Web, o Shaaka Packager é a única maneira de realizar algumas tarefas sem gastar dinheiro com aplicativos comerciais caros.

Este é o padrão básico de um comando do Shaka Packager:

packager stream_descriptor [stream_descriptor-2 [stream_descriptor-n]] [flags]

Não é bem isso que você recebe ao digitar packager -help. Esse exemplo é mais fácil de entender e reflete os exemplos na documentação do Shaka Packager. Há vários itens stream_descriptor no padrão. Embora não apareça, é possível manipular os streams de vídeo e áudio de um arquivo separadamente em um único comando.

Compare esse padrão básico com um uso simples que exibe as características do arquivo. No exemplo, alinhamos partes equivalentes.

packager stream_descriptor [stream_descriptor-n] [flags]

packager input=glocken.mp4                       --dump_stream_info

A resposta ao comando é:

File "glocken.mp4":
Found 2 stream(s).
Stream [0] type: Video
 codec_string: avc1.640028
 time_scale: 30000
 duration: 300300 (10.0 seconds)
 is_encrypted: false
 codec: H264
 width: 1920
 height: 1080
 pixel_aspect_ratio: 1:1
 trick_play_factor: 0
 nalu_length_size: 4

Stream [1] type: Audio
 codec_string: mp4a.40.2
 time_scale: 48000
 duration: 481280 (10.0 seconds)
 is_encrypted: false
 codec: AAC
 sample_bits: 16
 num_channels: 2
 sampling_frequency: 48000
 language: eng
 seek_preroll_ns: 20833

Procure as características discutidas nas Noções básicas sobre arquivos de mídia e observe alguns aspectos. A altura e a largura estão corretas para Full HD. Os codecs de áudio e vídeo estão entre os codecs preferidos para os tipos de contêiner, AAC para áudio e H264 para vídeo. Observe também que os streams são identificados com números. Eles são úteis em operações que manipulam o áudio e o vídeo separadamente.

O resultado acima não mostra a taxa de bits. Apesar do que está faltando, essa saída é mais fácil de ler, então a usamos sempre que possível. Quando precisamos de informações que o Shaka Packager não consegue receber, como a taxa de bits, usamos o FFmpeg.

FFmpeg

O FFmpeg também é um aplicativo sem custo financeiro para gravar, converter e transmitir arquivos de mídia. Os recursos dele não são melhores nem piores que os do Shaka Packager. São apenas diferentes.

Este é o padrão básico de um comando FFmpeg:

ffmpeg [GeneralOptions] [InputFileOptions] -i input [OutputFileOptions] output

Assim como o Shaka Packager, esse aplicativo pode lidar com vários streams. Algumas das opções são usadas em vários locais e manipulam a saída do arquivo de maneira diferente, dependendo de onde elas estão no comando. Esteja ciente disso ao analisar as perguntas do FFmpeg no Stack Overflow e em sites semelhantes.

Vamos comparar novamente o padrão básico com o exemplo para exibir as características do arquivo.

    ffmpeg [GeneralOptions] [InputFileOptions] -i input        [OutputFileOptions] output

    ffmpeg                                     -i glocken.mp4

Além das informações solicitadas, isso também gera uma mensagem de erro, conforme mostrado no exemplo abaixo. Isso porque esse é tecnicamente um uso incorreto do FFmpeg. Nós a usamos porque ela mostra informações que são importantes para nós.

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'glocken.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf58.17.100
  Duration: 00:01:47.53, start: 0.000000, bitrate: 10715 kb/s
    Stream #0:0(eng): Video: h264 (High) (avc1 / 0x31637661), yuvj420p(pc), 1920x1080, 10579 kb/s, 29.97 fps, 29.97 tbr, 30k tbn, 59.94 tbc (default)
    Metadata:
      handler_name    : VideoHandler
    Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (default)
    Metadata:
      handler_name    : SoundHandler
At least one output file must be specified

Como instalar aplicativos com o Docker

Se você planeja acompanhar e testar nossos comandos, pode instalar as ferramentas necessárias manualmente ou seguir o caminho mais fácil e usar o Docker. Sugerimos usar o Docker, porque isso vai economizar muito tempo. Além disso, fornecemos instruções para que você faça a configuração rapidamente.

  1. Comece criando um novo diretório em algum lugar do computador chamado media-tools. Você pode usar o nome que quiser, mas observe que as instruções a seguir presumem que você está usando media-tools como o nome do diretório.

  2. Crie um diretório docker e media dentro de media-tools. Isso manterá o diretório media fora do contexto de build. Isso é importante porque media é onde serão armazenados os arquivos em que planejamos fazer operações, e alguns deles podem ser muito grandes. Colocar o Dockerfile diretamente em media-tools vai deixar a criação da imagem mais lenta caso você a recrie no futuro, talvez para mudar as versões instaladas.

  3. Crie /media-tools/docker/Dockerfile e adicione estas instruções de build:

    FROM google/shaka-packager:release-v2.4.3 as packager
    FROM jrottenberg/ffmpeg:4.3.2-alpine38
    COPY --from=packager /usr/bin /usr/bin
    ENTRYPOINT  ["sh"]
    
  4. Crie a imagem:

    docker build -t media-tools ./docker
    
  5. Execute a imagem como um shell interativo. No Linux:

    docker run -w /media -v ${PWD}/media:/media -it --rm media-tools
    /media #
    

    No Windows:

    docker run -w /media -v %cd%/media:/media -it --rm media-tools
    /media #
    

Ao executar a imagem, é possível verificar as versões do FFmpeg e do Shaka Packager para validar se tudo foi bem-sucedido executando ffmpeg -version e packager --version. O resultado será semelhante a este:

/media # ffmpeg -version
ffmpeg version 4.3.2 Copyright (c) 2000-2021 the FFmpeg developers
built with gcc 6.4.0 (Alpine 6.4.0)
configuration: --disable-debug --disable-doc --disable-ffplay --enable-shared --enable-avresample --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-gpl --enable-libass --enable-fontconfig --enable-libfreetype --enable-libvidstab --enable-libmp3lame --enable-libopus --enable-libtheora --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libxcb --enable-libx265 --enable-libxvid --enable-libx264 --enable-nonfree --enable-openssl --enable-libfdk_aac --enable-postproc --enable-small --enable-version3 --enable-libbluray --enable-libzmq --extra-libs=-ldl --prefix=/opt/ffmpeg --enable-libopenjpeg --enable-libkvazaar --enable-libaom --extra-libs=-lpthread --enable-libsrt --enable-libaribb24 --extra-cflags=-I/opt/ffmpeg/include --extra-ldflags=-L/opt/ffmpeg/lib
libavutil      56. 51.100 / 56. 51.100
libavcodec     58. 91.100 / 58. 91.100
libavformat    58. 45.100 / 58. 45.100
libavdevice    58. 10.100 / 58. 10.100
libavfilter     7. 85.100 /  7. 85.100
libavresample   4.  0.  0 /  4.  0.  0
libswscale      5.  7.100 /  5.  7.100
libswresample   3.  7.100 /  3.  7.100
libpostproc    55.  7.100 / 55.  7.100
/media # packager --version
packager version v2.4.3-dd9870075f-release

Agora que você já testou o uso do Shaka Packager e do FFmpeg, pode continuar aprendendo os conceitos básicos, a seguir, a seguir, Noções básicas de streaming de mídia.