Tìm hiểu về codec âm thanh MPEG: từ MP3 đến xHE-AAC

Định dạng âm thanh MPEG được biết đến rộng rãi nhất và cũng thông dụng nhất chính là MP3, xuất hiện từ năm 1998. Cũng kể từ lúc đó, Fraunhofer IIS và những đơn vị tham gia phát triển định dạng ISO-MPEG ngày càng cải tiến nó hơn nữa và mang đến những chuẩn codec mới với chất lượng cao hơn. Có thể nói các chuẩn codec MPEG mới được ra đời đã tạo nên những bước ngoặc to lớn, làm thay đổi cách âm nhạc được tiêu thụ.


ISO-MPEG: Cái nôi của những codec thông dụng hiện nay


Chuẩn mã hóa âm thanh và hình ảnh MPEG (viết tắt từ Moving Picture Experts Group) được ra đời từ năm 1988 dựa trên tiêu chuẩn ISO (International Organization for Standardization). Tên đầy đủ của nhóm phát triển MPEG-ISO là ISO/IEC JTC 17SC 29/WG 11.2 tập hợp các chuyên gia từ hơn 200 công ty của gần 20 quốc gia trên toàn thế giới.
Các phân nhánh nổi bật nhất của tiêu chuẩn MPEG gồm MPEG-1, MPEG-2 và MPEG-4, ngoài ra cũng có thể nhắc đến các chuẩn mới gần đây như MPEG-D hay MPEG-DASH. Hiện nay đa số các trang web vẫn sử dụng codec MPEG-4 AVC/H.264 cũng được phát triển và tiêu chuẩn hóa từ MPEG.


MPEG - Layer 3



MPEG - Layer 3, hay được biết thông dụng hơn với tên MP3, là codec nén nhạc được phát triển từ đầu những năm ’80 và chính thức đưa vào sử dụng vào năm 1995 bằng các file có đuôi .mp3. Đến năm 1998, định dạng MP3 làm chủ thị trường nhạc bằng sự tiện dụng của nó, chủ yếu đến từ khả năng lưu trữ nhỏ gọn nhưng vẫn giữ được hầu hết những chi tiết nhạc mà tai người có thể nghe thấy, nói cách khác là không làm bài nhạc giảm chất lượng quá nhiều.


Thuật toán nén MP3 lược bỏ đi những chi tiết âm thanh mà tai người khó có thể nghe thấy được để tiết kiệm dung lượng lưu trữ. Với người nghe nhạc chuyên nghiệp, những khiếm khuyết của file .mp3 là có thể nhận ra được, tuy nhiên đối với người nghe không chuyên thì họ không quá quan tâm đến vấn đề này (với file có chất lượng tối thiểu 192kbits/s). Thuật toán cũng được sử dụng trong codec AAC.


AAC


Trước khi MP3 làm mưa làm gió trên thị trường, codec AAC (Advanced Audio Coding) đã được phát triển và ứng dụng cũng theo phương pháp giảm chi tiết âm thanh để giảm dung lượng lưu trữ. Codec AAC xuất hiện từ năm 1994 và đến 2012 thì nâng cấp thành Extended HE-AAC.


Phiên bản đầu tiên của AAC được phát triển từ MPEG-2, sau đó được ứng dụng theo tiêu chuẩn MPEG-4 với các tính năng lọc tiếng ồn (Perceptual Noise Shaping - PNS), nhân bản băng tần (Spectral Band Replication - SBR) và Parametric Stereo (PS).


AAC-LC



AAC-LC (Low Complexity) cũng là một profile codec của chuẩn MPEG-4 với mục tiêu giúp tăng cường chất lượng âm thanh làm hài lòng cả những người nghe chuyên nghiệp khó tính. AAC-LC có chất lượng từ 128 ~ 192 kbits/s (đối với stereo) và 320 kbits/s (đối với multi-channel). Codec AAC-LC có băng tần từ 8 ~ 192 kHz, bitrate 256 kbits/s và tối đa 48 kênh, được sử dụng nhiều nhất trên dịch vụ Apple iTunes và đăng ký tiêu chuẩn Japanese ISDB cho các dòng TV kỹ thuật số.


HE-AAC và HE-AACv

HE-AAC (High Efficiency Profile) kết hợp những điểm mạnh của MPEG-4 AAC-LC và công cụ SBR để giảm hơn nữa bitrate mà vẫn giữ chất lượng âm thanh cao nhất có thể. HE-AAC có thể làm việc ở mức dưới 128 kbits/s cho tín hiệu stereo, giảm 30% bitrate so với AAC-LC nhưng vẫn cung cấp chất lượng tương đương.

Codec HE-AAC sử dụng AAC-LC để mã hóa dải thấp và công cụ SBR để mã hóa dải cao, đồng thời cũng sử dụng công cụ SBR để làm mượt chuyển tiếp từ dải thấp lên dải cao để âm thanh tổng thể được tự nhiên hơn. Dải thấp được mã hóa bởi AAC-LC cũng chỉ có sample rate bằng một nửa so với tín hiệu tổng thể.

HE-AAC thường sử dụng bitrate 48 ~ 64-kbit/s (stereo) hoặc 160-kbit/s (multi-channel), và theo thông số kỹ thuật thì vẫn hỗ trợ 8 ~ 192 kHz / 48 channel.


HE-AACv2 (High Efficiency AAC v2 Profile) là phiên bản nâng cấp của HE-AAC được tích hợp thêm công cụ PS. Ưu điểm của HE-AACv2 là càng có thể giảm bitrate hơn nữa, có thể đạt đến mức ấn tượng chỉ 24 ~ 32-kbit/s cho tín hiệu stereo.


Codec HE-AACv2 hiện nay chủ yếu sử dụng trong các đài phát thanh và truyền hình kỹ thuật số ở những nước phát triển. Một số quốc gia như Brazil hay các nước Nam Mỹ tuy nhiên vẫn sử dụng chủ yếu là HE-AAC.




HE-AAC được ứng dụng nhiều nhất trong Smart TV và các chương trình truyền hình chất lượng cao như Hybrid Broadcast Broadband TV (HbbTV), HD-TV, Smart TV-Box, ngoài ra cũng được sử dụng trên hầu hết các nền tảng streaming và nội dung kỹ thuật số gồm Flash, Silverlight, Windows Media Player, Winamp hay iTunes. HE-AAC và HE-AACv2 tương thích hoàn hảo với các hệ điều hành Mac OS X, Windows, iOS, Android, Windows Phone, Symbian và BlackBerry. Hiện nay các hình thức stream http-adaptive có hỗ trợ HE-AAC như Apple HLS, Microsoft Smooth Streaming và Adobe Dynamic Streaming đều có nguồn gốc từ chuẩn AAC.


HE-AACv2 là một phần quan trọng trong các tiêu chuẩn stream thông dụng như Open IPTV Forum, ATIS, HbbTV và DLNA. Hầu như tất cả những chiếc TV kỹ thuật số, đầu Blu-ray, TV-Box, máy chơi game console... đều hỗ trợ codec này. Các dịch vụ web-radio như Pandora, Aupeo, Hulu và BBC iPlayer cũng mã hóa nội dung dựa trên HE-AACv2.


MPEG Surround


Công nghệ MPEG Surround có thể được xem như là bản mở rộng của Parametric Stereo từ stereo sang multi-channel. MPEG Surround có tỷ lệ giữa bitrate và chất lượng âm thanh cân bằng hơn và cho phép kết hợp với các codec thuộc series AAC nhằm mang lại hiệu năng cao hơn. MPEG Surround cũng tương thích ngược với tín hiệu stereo.


Dòng tín hiệu luôn sẽ có tín hiệu stereo được mã hóa AAC và MPEG Surround giống như một “phần phụ thêm”. Tín hiệu stereo sẽ được bộ giải mã trích xuất và sử dụng như dòng tín hiệu chính, trong khi đó MPEG Surround sẽ giúp tái tạo tín hiệu multi-channel, cho phép ta ứng dụng nó như một giải pháp nâng cấp ít chi phí cho hệ thống của mình.


Low-Delay Audio Codec



Codec MPEG được ứng dụng trong các thiết bị liên lạc và truyền thông để cung cấp các dịch vụ với công nghệ Full-HD Voice. Công nghệ này sở hữu chất lượng âm thanh tốt nhất hiện nay cho các hệ thống liên lạc và truyền thông với băng tần lên đến hơn 14 kHz. Các cuộc gọi có hỗ trợ công nghệ Full-HD Voice cho âm thanh trong trẻo như đang trò chuyện trực tiếp với người bên kia. Series codec Full-HD Voice gồm các chuẩn codec Low Delay AAC (AAC-LD), Enhanced Low Delay AAC (AAC-ELD) và Enhanced Low Delay AACv2 (AAC-ELDv2).


AAC-LD được sử dụng trong các cuộc gọi đòi hỏi sự ổn định cao, có mức delay chỉ 20ms và cho chất lượng âm thanh khá tốt.


AAC-ELD được nâng cấp từ AAC-LD, kết hợp giữa MPEG-4 AAC-LD và công cụ SBR để giữ độ ổn định cao nhất khi truyền tải, cho chất lượng âm thanh rất tốt chỉ với bitrate 24 kbits/s. AAC-LD và AAC-ELD từ lâu đã được ứng dụng trong app Apple FaceTime.


AAC-ELDv2 là bản nâng cấp của AAC-ELD giúp giảm bitrate luôn ở mức thấp nhất cho tín hiệu stereo. AAC-ELDv2 tối ưu quá trình giải mã multi-channel bằng cách chỉ truyền tải một kênh mono cùng một số chi tiết âm thanh cần thiết nhất để đảm bảo chất lượng thay vì truyền cả hai kênh.


Extended HE-AAC



Extended HE-AAC ra mắt vào đầu năm 2012. Bằng cách ứng dụng những công nghệ mới nhất vào thời điểm đó, nó có thể làm việc với mức bitrate cực thấp chỉ 8-kbit/s, đồng thời vẫn hỗ trợ tốt các mức bitrate cao hơn như 24/32/64 kbits/s. Extended HE-AAC cũng tương thích với HE-AAC.


Nhờ những ưu điểm nổi bật của Extended HE-AAC, nó đang dần dần được thay thế cho codec HE-AAC và HE-AACv2 đã lỗi thời so với nhu cầu hiện tại.

Post a Comment

Mới hơn Cũ hơn