Thông tin cơ bản về ứng dụng đa phương tiện

Derek Herman
Derek Herman
Joe Medley
Joe Medley

Khi xử lý nội dung nghe nhìn, thông thường, bạn phải thay đổi các đặc điểm của tệp nội dung nghe nhìn, chẳng hạn như tốc độ bit hoặc độ phân giải. Việc tìm được một cách đơn giản để bắt đầu có thể khá khó khăn. Trên trang này, bạn sẽ tìm hiểu về các công cụ được dùng và cách cài đặt nhanh chóng.

Đầu tiên, chúng tôi mô tả cách sử dụng cơ bản cho hai tiện ích phương tiện dòng lệnh phổ biến: Shaka PackagerFFmpeg, sau đó chúng tôi sẽ giúp bạn nhanh chóng cài đặt các công cụ này. Tại sao lại đề cập đến hai ứng dụng? Mặc dù bản thân cả hai đều mạnh mẽ và hữu ích, nhưng không thực hiện mọi thứ cần thiết để chuẩn bị nội dung đa phương tiện cho web. Chúng tôi cũng tạo các trang Chuyển đổi nội dung nghe nhìnMã hoá nội dung nghe nhìn để cho thấy nhiều thao tác phổ biến hơn với 2 ứng dụng này.

Các ứng dụng này không phải là tuỳ chọn duy nhất hiện có để thực hiện các thao tác đối với tệp, nhưng là hai trong số những ứng dụng phổ biến và mạnh mẽ nhất. Các tuỳ chọn khác bao gồm ứng dụng GUI Miro, HandBrakeVLC. Ngoài ra, còn có các dịch vụ mã hoá/chuyển mã như Zencoder, Amazon Elastic EncoderGoogle Transcoder API.

Bộ đóng gói Shaka

Shaka Packager là một SDK đóng gói nội dung đa phương tiện miễn phí. Nếu bạn đang sử dụng trình phát nội dung đa phương tiện trên trang web của mình, thì Shaka Packager là công cụ bạn sẽ sử dụng để chuẩn bị tệp. Tính năng này hỗ trợ lượt chuyển đổi cho 2 giao thức truyền video phổ biến nhất: Truyền phát thích ứng động qua HTTP (DASH) hoặc Phát trực tiếp qua HTTP (HLS). Shaka Packager hỗ trợ các tính năng bảo mật chính: mã hoá thông thường và quản lý quyền kỹ thuật số (DRM). Kênh này cũng có thể xử lý cả sự kiện phát trực tiếp và video theo yêu cầu.

Mặc dù có nội dung trên gói, nhưng tiện ích này không chỉ dành cho các nhà phát triển C++. Bạn có thể dùng ứng dụng này làm thư viện để xây dựng phần mềm nội dung đa phương tiện, vừa làm tiện ích dòng lệnh để chuẩn bị các tệp nội dung nghe nhìn để phát trên web. Đó là dung lượng sau cùng rất hữu ích cho chúng ta ở đây. Trên thực tế, đối với các nhà sáng tạo nội dung đa phương tiện trên web, Schaka Packager là cách duy nhất để thực hiện một số thao tác mà không phải tốn tiền cho các ứng dụng thương mại đắt tiền.

Dưới đây là mẫu cơ bản cho lệnh Shaka Packager:

packager stream_descriptor [stream_descriptor-2 [stream_descriptor-n]] [flags]

Đây không phải là nội dung bạn nhận được nếu nhập packager -help. Ví dụ này dễ giải thích hơn và phản ánh các ví dụ trong tài liệu về Trình tạo gói SSH. Lưu ý có nhiều mục stream_descriptor trong mẫu. Mặc dù chúng tôi không hiển thị tính năng này, nhưng bạn có thể thao tác với các luồng video và âm thanh của tệp một cách riêng biệt trong một lệnh.

So sánh mẫu cơ bản này với cách sử dụng đơn giản để hiển thị đặc điểm tệp. Trong ví dụ này, chúng tôi đã sắp xếp các phần tương đương.

packager stream_descriptor [stream_descriptor-n] [flags]

packager input=glocken.mp4                       --dump_stream_info

Lệnh tạo ra như sau:

File "glocken.mp4":
Found 2 stream(s).
Stream [0] type: Video
 codec_string: avc1.640028
 time_scale: 30000
 duration: 300300 (10.0 seconds)
 is_encrypted: false
 codec: H264
 width: 1920
 height: 1080
 pixel_aspect_ratio: 1:1
 trick_play_factor: 0
 nalu_length_size: 4

Stream [1] type: Audio
 codec_string: mp4a.40.2
 time_scale: 48000
 duration: 481280 (10.0 seconds)
 is_encrypted: false
 codec: AAC
 sample_bits: 16
 num_channels: 2
 sampling_frequency: 48000
 language: eng
 seek_preroll_ns: 20833

Tìm các đặc điểm được thảo luận trong bài viết Kiến thức cơ bản về tệp nội dung nghe nhìn và lưu ý một số điều. Chiều cao và chiều rộng sẽ chính xác đối với độ phân giải HD đầy đủ. Đồng thời, bộ mã hoá và giải mã âm thanh và video là một trong những bộ mã hoá và giải mã được ưu tiên cho các loại vùng chứa, AAC cho âm thanh và H264 cho video. Ngoài ra, xin lưu ý rằng các luồng được xác định bằng số. Các hàm này rất hữu ích cho các thao tác thao tác riêng biệt âm thanh và video.

Lưu ý rằng kết quả ở trên không cho thấy tốc độ bit. Mặc dù còn thiếu tính năng nào, nhưng kết quả này dễ đọc hơn, vì vậy chúng tôi có thể sử dụng nó bất cứ khi nào có thể. Khi cần thông tin mà Shaka Packager không lấy được, chẳng hạn như tốc độ bit, chúng tôi sẽ sử dụng FFmpeg.

FFmpeg

FFmpeg cũng là một ứng dụng miễn phí để ghi, chuyển đổi và truyền trực tuyến các tệp nội dung nghe nhìn. Các tính năng của Shaka Packager không tốt hay kém hơn. Chúng khác nhau.

Mẫu cơ bản cho lệnh FFmpeg có dạng như sau:

ffmpeg [GeneralOptions] [InputFileOptions] -i input [OutputFileOptions] output

Giống như Shaka Packager, ứng dụng này có thể xử lý nhiều luồng. Một số tuỳ chọn được dùng ở nhiều vị trí và thao tác với kết quả đầu ra tệp theo cách khác nhau tuỳ thuộc vào vị trí của chúng trong lệnh. Hãy lưu ý điều này khi bạn xem các câu hỏi về FFmpeg trên Stack Overflow và các trang web tương tự.

Chúng ta sẽ so sánh lại mẫu cơ bản với ví dụ hiển thị các đặc điểm của tệp.

    ffmpeg [GeneralOptions] [InputFileOptions] -i input        [OutputFileOptions] output

    ffmpeg                                     -i glocken.mp4

Ngoài thông tin chúng tôi đã yêu cầu, thao tác này cũng in thông báo lỗi như trong ví dụ bên dưới. Lý do là về mặt kỹ thuật, đây là cách sử dụng FFmpeg không chính xác. Chúng tôi sử dụng hồ sơ này vì nó hiển thị thông tin mà chúng tôi quan tâm.

Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'glocken.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf58.17.100
  Duration: 00:01:47.53, start: 0.000000, bitrate: 10715 kb/s
    Stream #0:0(eng): Video: h264 (High) (avc1 / 0x31637661), yuvj420p(pc), 1920x1080, 10579 kb/s, 29.97 fps, 29.97 tbr, 30k tbn, 59.94 tbc (default)
    Metadata:
      handler_name    : VideoHandler
    Stream #0:1(eng): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, stereo, fltp, 128 kb/s (default)
    Metadata:
      handler_name    : SoundHandler
At least one output file must be specified

Cài đặt ứng dụng bằng Docker

Nếu định làm theo và thử dùng các lệnh của chúng tôi, bạn có thể cài đặt các công cụ cần thiết theo cách thủ công hoặc sử dụng Docker một cách dễ dàng. Bạn nên sử dụng Docker, vì điều này sẽ giúp bạn tiết kiệm rất nhiều thời gian. Ngoài ra, chúng tôi đã cung cấp các hướng dẫn giúp bạn thiết lập nhanh chóng.

  1. Bắt đầu bằng cách tạo một thư mục mới có tên là media-tools trên máy tính; bạn có thể dùng bất kỳ tên nào tuỳ thích, chỉ cần lưu ý rằng hướng dẫn sau đây giả định bạn đang sử dụng media-tools làm tên thư mục.

  2. Tạo thư mục dockermedia bên trong media-tools. Thao tác này sẽ tách thư mục media của bạn khỏi ngữ cảnh bản dựng. Điều này rất quan trọng vì media là nơi lưu trữ các tệp mà chúng ta dự định thực hiện các thao tác trên đó và một số tệp trong số đó có thể khá lớn. Việc đặt Dockerfile trực tiếp vào media-tools sẽ làm chậm quá trình tạo hình ảnh nếu bạn đã từng xây dựng lại hình ảnh – có thể bạn phải thay đổi các phiên bản đã cài đặt.

  3. Tạo /media-tools/docker/Dockerfile và thêm hướng dẫn tạo sau đây:

    FROM google/shaka-packager:release-v2.4.3 as packager
    FROM jrottenberg/ffmpeg:4.3.2-alpine38
    COPY --from=packager /usr/bin /usr/bin
    ENTRYPOINT  ["sh"]
    
  4. Tạo hình ảnh:

    docker build -t media-tools ./docker
    
  5. Chạy hình ảnh dưới dạng một shell tương tác. Trên Linux:

    docker run -w /media -v ${PWD}/media:/media -it --rm media-tools
    /media #
    

    Trên Windows:

    docker run -w /media -v %cd%/media:/media -it --rm media-tools
    /media #
    

Trong khi chạy hình ảnh, bạn có thể kiểm tra các phiên bản của cả FFmpeg và Shaka Packager để xác thực mọi thứ đã thành công bằng cách chạy ffmpeg -versionpackager --version. Kết quả đầu ra sẽ có dạng như sau:

/media # ffmpeg -version
ffmpeg version 4.3.2 Copyright (c) 2000-2021 the FFmpeg developers
built with gcc 6.4.0 (Alpine 6.4.0)
configuration: --disable-debug --disable-doc --disable-ffplay --enable-shared --enable-avresample --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-gpl --enable-libass --enable-fontconfig --enable-libfreetype --enable-libvidstab --enable-libmp3lame --enable-libopus --enable-libtheora --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libxcb --enable-libx265 --enable-libxvid --enable-libx264 --enable-nonfree --enable-openssl --enable-libfdk_aac --enable-postproc --enable-small --enable-version3 --enable-libbluray --enable-libzmq --extra-libs=-ldl --prefix=/opt/ffmpeg --enable-libopenjpeg --enable-libkvazaar --enable-libaom --extra-libs=-lpthread --enable-libsrt --enable-libaribb24 --extra-cflags=-I/opt/ffmpeg/include --extra-ldflags=-L/opt/ffmpeg/lib
libavutil      56. 51.100 / 56. 51.100
libavcodec     58. 91.100 / 58. 91.100
libavformat    58. 45.100 / 58. 45.100
libavdevice    58. 10.100 / 58. 10.100
libavfilter     7. 85.100 /  7. 85.100
libavresample   4.  0.  0 /  4.  0.  0
libswscale      5.  7.100 /  5.  7.100
libswresample   3.  7.100 /  3.  7.100
libpostproc    55.  7.100 / 55.  7.100
/media # packager --version
packager version v2.4.3-dd9870075f-release

Sau khi thử dùng Shaka Packager và FFmpeg, bạn có thể tiếp tục tìm hiểu các khái niệm cơ bản, tiếp theo là phần Kiến thức cơ bản về phát trực tuyến nội dung nghe nhìn.