Video 101: Video Codecs

Phim nhựa celluloid vs. tệp Digital raw

Phim nhựa âm bản (celluloid negative) được dùng trong làm phim trước đây chứa nhiều thông tin (ánh sáng, màu sắc) hơn rất nhiều so với bản phim đã in ra để trình chiếu trong rạp. Sau khi quay về, phim âm bản sẽ được xử lý, nhóm lab và DP quyết định sử dụng bao nhiêu ánh sáng (cũng như màu sắc của ánh sáng) để tạo ra bản in sẽ được sử dụng trong phim.

Theo cách này, phim âm bản rất linh hoạt; chúng ta có thể thực hiện các thay đổi đối với hình ảnh sau khi đã ghi hình. (ví dụ: để điều chỉnh độ phơi sáng hoặc cân bằng màu sắc của ảnh chụp). Vì nó chứa nhiều thông tin hơn mức cần thiết. 

Tệp raw là một loại âm bản kỹ thuật số. Các nhiếp ảnh gia sử dụng các tệp raw và xử lý hình ảnh bằng phần mềm như Adobe Lightroom, phần mềm này cố tình lấy cảm hứng từ phòng tối nhiếp ảnh truyền thống. Cái tên Lightroom là ý tưởng rằng đây là một quá trình tương tự như việc chỉnh sửa và in các bức ảnh phim nhựa trong phòng tối, nhưng là phiên bản kỹ thuật số của quá trình này.

Trong thế giới kỹ thuật số, raw là lựa chọn tốt nhất về tính linh hoạt và chất lượng để làm hậu kỳ. Một tệp raw cho phim về cơ bản là một chuỗi các hình ảnh tĩnh được đóng gói cùng nhau trong một thư mục. Mỗi hình ảnh raw chứa tất cả thông tin từ cảm biến hình ảnh từ các kênh màu đỏ, xanh lục và xanh lam (RGB). Điều này trái ngược với tất cả các loại tệp video khác, khi mà sự pha trộn cụ thể của thông tin kênh màu đã được quyết định ở giai đoạn cân bằng trắng và cố định vào hình ảnh video, loại bỏ phần còn lại của thông tin khỏi cảm biến.

Video Codec 

Hình dung một tệp video giống như một cuộn phim nhựa số, hoặc như một thư mục chứa chuỗi các hình ảnh raw, chúng sẽ có dung lượng rất lớn. Rất tốn thời gian, tiền bạc và gặp nhiều khó khăn trong phim phân phối và phát hành một bộ phim ở dạng raw – dạng không nén (lossless).

Để việc này trở nên dễ dàng hơn, người ta sẽ phải dùng các kỹ thuật/công nghệ để nén video xuống dung lượng nhỏ hơn. Sau đó dùng kỹ thuật/công nghệ để giải nén trước khi xem. Quá trình nén (compressing) và giải nén (decompressing) đó chính là nền tảng hình thành thuật ngữ codec.

Video codec là:

  1. Phần cứng hoặc phần mềm bên trong camera để nén tệp video khi nó được tạo.
  2. Phần cứng hoặc phần mềm giải nén tệp video để có thể xem được video trên các thiết bị hiển thị. Phần cứng và phần mềm đó có thể là TV (có khả năng phát tệp video từ USB hoặc qua internet) hoặc điện thoại hoặc máy tính. 

Có nhiều phương pháp khác nhau để làm điều này. Mỗi phương pháp được phát triển bởi một công ty riêng biệt, do đó có rất nhiều codec đang được sử dụng hiện nay. Một số codec thuộc sở hữu của nhà phát triển và một số là tiêu chuẩn mã nguồn mở được sử dụng miễn phí. Một số codec là cũ và một số là mới. Các codec mới hơn có xu hướng là những codec tốt hơn và cuối cùng sẽ thay thế những codec cũ hơn. 

Codec luôn được cải tiến, một phần là do những tiến bộ của sức mạnh tính toán. Máy tính hiện nay mạnh đến mức điện thoại di động có nhiều khả năng hơn máy tính để bàn cách đây 10 năm. Khi máy tính ngày càng phát triển, sức mạnh tiềm tàng của codec cũng vậy, có thể nén các tệp xuống kích thước ngày càng nhỏ hơn mà không làm mất nhiều chi tiết trong hình ảnh cuối cùng.

Một vài video codecs phổ biến:

Containers 

Vẫn tồn tại một số nhầm lẫn về cái gì là codec và không phải là codec. Ví dụ: bạn thường nghe sinh viên và thậm chí các chuyên gia nói điều gì đó như “vui lòng cung cấp tệp .MOV/MP4” hoặc “Tôi đã xuất tệp .MOV để nó hoạt động”. Nói một cách đơn giản rằng một tệp là .MOV không thực sự nói nhiều về những gì codec đang được sử dụng.

Tệp .MP4 là loại tệp MPEG-4 được phát triển bởi International Organization of Standardization (ISO). Codec thực tế được sử dụng trong tệp .MP4 có thể là h.264, h.265 và một số thứ khác nhau. Tệp .MP4 chỉ đơn giản là một vùng chứa (container), chứa luồng video và luồng âm thanh. 

Nếu điều này gây nhầm lẫn, hãy luôn nhớ rằng có một phương pháp nén riêng được sử dụng cho một luồng video và một phương pháp nén riêng được sử dụng cho một luồng âm thanh. Hai thứ này tách biệt nhau mặc dù chúng ta có thể nghĩ chúng giống nhau bởi vì chúng liên kết mật thiết với nhau. Video và âm thanh phát cùng lúc và có mối tương quan trực tiếp giữa video và âm thanh, vì vậy chúng ta có xu hướng nghĩ chúng giống nhau, nhưng không phải vậy. Thứ kết nối hai phần tử riêng biệt này chính là tệp vùng chứa (container).

Ngoài chứa video vào audio, một số container có thể chứa các thông tin khác, chẳng hạn như metadata (thông tin về người tạo video, thông tin bản quyền và ngày tháng, v.v.) cũng như thông tin phụ đề, …

Đó là tệp vùng chứa (container file) chứa các loại luồng thông tin khác nhau: video, âm thanh, siêu dữ liệu và phụ đề.

Một quy tắc đơn giản là: nếu file có phần mở rộng – thường được gọi là định dạng tệp (file format), thì nó có khả năng là một vùng chứa. Ví dụ: .MOV hoặc .MXF.

Trong một số trường hợp, khi xử lý một luồng (âm thanh hoặc video hoặc đồ họa), codec có thể giống với phần mở rộng tệp. Ví dụ, một MP3 cũng có phần mở rộng là .MP3. Điều này là do tệp .MP3 sử dụng codec âm thanh MP3.

Một vài video container phổ biến:

Các định dạng ghi hình (Recording formats)

Để làm phức tạp thêm vấn đề, nhiều nhà sản xuất camera chuyên nghiệp đã phát triển các cách cụ thể để ghi lại cảnh quay video (thường sử dụng codec h.264) nhưng theo những cách phức tạp hơn. Chúng được gọi là các định dạng ghi hình (recording formats). Các định dạng này sắp xếp các luồng video, âm thanh và metadata vào các thư mục được sắp xếp rất cụ thể.

Nếu bạn đang có camera sử dụng một trong các loại định dạng ghi này (chẳng hạn như AVCHD), bạn nên sao chép toàn bộ thư mục của thẻ sau khi quay, thay vì chỉ copy thư mục chứa các file video. Các thư mục khác trong cấu trúc thư mục AVCHD chứa thông tin quan trọng mà bạn có thể cần. Tốt nhất là sao chép đầy đủ, cho dù trước đây bạn chỉ chọn các tệp video và vẫn ổn.

Một số định dạng ghi hình thường gặp:

Đóng gói chiếu rạp | Digital cinema packages (DCPs)

Đóng gói cho rạp chiếu phim kỹ thuật số (DCP) là một phương pháp tiêu chuẩn hóa để phân phối video và âm thanh chất lượng rạp chiếu phim để sử dụng với máy chiếu. DCP sử dụng một chuỗi các tệp hình ảnh JPEG 2000 riêng lẻ và một tệp âm thanh, được đặt trong vùng chứa .MXF. JPEG 2000 là phiên bản nâng cao của định dạng ảnh JPEG cũ vẫn được sử dụng rộng rãi cho đến ngày nay.

Có những công ty sẽ tạo DCP cho bạn nếu bạn muốn chiếu phim tại một số liên hoan hoặc rạp chiếu phim nhất định và cũng có thể tạo một DCP bằng Adobe Premiere Pro hoặc các trình tạo DCP độc lập khác, chẳng hạn như easyDCP.

DCP thường có kích thước vừa với khung rạp chiếu phim (C2K hoặc C4K) nhưng cũng có thể được xuất ra ở định dạng HD hoặc UHD (16: 9).