■ AC3, 돌비디지탈
돌비 디지탈은 CD에 근접한 수준의 멀티채널 사운드를 저장하는 디지탈 포맷입니다.
그러나 일반적인 CD에 비해 더 적은 비트의 데이터로 저장합니다.
일반 소비자용 미디어에 6채널(5.1)을 눌러담을 수 있는 것은 돌비 디지털의 데이터 레이트가 낮기 때문이지요.
돌비 디지탈 인코더는 신호를 디지털 형태로 전환한 다음, 어떤 소리를 덜 들리게 할지 결정하기 위해 신호를 분석합니다.
예를 들어, 폭발장면에서 새의 지저귀는 소리는 잘 들리지 않을 것이므로 새의 울음 소리는 무시하고 폭발음만을 인코딩합니다.
이러한 퍼셉츄얼 코딩(perceptual coding) 기술을 사용하면 비트의 수를 줄일 수 있는데, 실제로는 퍼셉츄얼 코딩 처리과정은 대잔히 복잡하며, MP3는 퍼셉츄얼 코딩의 한 예입니다. (예시는 이해를 돕기 위한 설명임)
구체적으로 돌비 디지털은 6개의 채널 신호가 번갈아 줄지어 있는 단일의 데이터스트림을 발생시킵니다.
이때의 데이터 레이트는 6채널에 대해 초당 38만4천비트(384kbps)이구요.
DVD에서는 448kbps의 데이터 레이트도 널리 사용되고 있습니다.
CD에서 2채널에 대해 발생되는 데이터스트림 레이트는 초당 141만1200비트(1411.2kbps)
즉 돌비 디지털은 각 오디오 채널에 CD에 사용된 1/10 이하의 비트로 인코딩된 것입니다.
★ MP3와 같은 손실압축 코덱에서 비트레이트가 높은 경우 시디와 차이를 구분하기 어려운 것은 사실이나,
지금 이 글 자체는 AC3가 시디포맷보다 월등히 좋은 포맷이 아님을 설명하기 위한 글이므로,
개인적인 선호도와 취향을 대입해 저와 논쟁을 하시지 않기를 바랍니다.
디지탈 방송의 표준인 AC3 코덱이 시디포맷과 다른 점은 위에서 간단히 설명드렸지만
1) 샘플링 레이트가 시디포맷은 44100 Hz AC3는 48000 Hz
2) 시디포맷은 비압축 무손실 PCM으로 비트레이트가 1411.2kbps 이나 AC3는 손실압축 포맷으로 최대 448kbps
3) 시디는 2채널 고정이지만, AC3는 총 6채널(5.1채널)까지 대응
이 3가지입니다.
44100과 48000 Hz의 차이는 우열관계가 아니라 오디오 전용(CD의 기본 샘플링레이트)과 영상에 덧붙일 오디오용의
즉, 용도가 다른 관계입니다.
시디에 비해 초당 3900개의 샘플을 더 재생하는 48000 Hz는 그것이 더 우월해서 정해놓은 것이 아닙니다.
시디의 샘플링 레이트가 정해질 무렵만 해도 당시로서는 방대한 양의 디지털 데이타를 저장할 매체가 없었습니다.
그래서 소니가 비디오 레코더를 사용해서 디지탈 데이타를 저장할 수 있도록 만든 것이 지금의 44100Hz 입니다.
디지탈 데이타의 0/1을 비디오의 흑백으로 나눠서 저장하는 방식인데,
PAL의 경우 588 라인에 3개의 샘플씩 25프레임을 저장하면 588 x 3 x 25 = 44100 이 나옵니다.
NTSC의 경우는 흑백 규격을 사용해 490 x 3 x 30 = 44100
DVD나 블루레이, 디지탈 방송등에 사용하는 48000Hz 혹은 이 주기의 정배수의 샘플링 레이트가 정해진 것도 역사적인 그리고 기술적인 배경이 있어서이지, 44100Hz 보다 더 좋아서 정한 것이 아닙니다.
(물론 20kHz를 넘어가는 초고역에서 2kHz 가량을 더 저장할 수 있지만 이대역은 가청영역이 아닙니다)
영상포맷에 오디오를 붙일 때에는 특히나 프레임당 처리해야 할 오디오 샘플이 매우 중요하게 됩니다.
그래서 특정한 주기(24fps, 60fps 등)에서 이것이 정수의 샘플을 처리하도록 만들어졌는데,
마침 이 표준을 정할 때 기존 방송에서 사용하던 샘플링 레이트가 32kHz 였고,
이것은 48kHz와 3:2 관계로 잘 맞아떨어지기도 했습니다.
기타 전화나 통신에서 사용하던 샘플링 레이트가 8kHz의 배수였다는 점도 이유로 언급을 합니다.
※ 더 자세한 것이 알고 싶으시면 AV 커뮤니티에 가셔서 전문가에게 도움을 받으시면 좋습니다.
거두절미하고 앞서서 다른 논문에서 44100Hz의 2배를 넘는 샘플링 레이트와 24비트 포맷에서도 더블 블라인드 테스트에서 시디와 구분하기 힘들다는 결과가 나온 것을 소개한 바가 있습니다.
하물며 44100과 48000은 1.08배, 기껏해야 초당 3900개의 샘플을 더 재생하는 정도입니다.
--------------------------------------
나는 가수다의 경우는 방송용과 판매용 음원의 마스터링 자체가 다릅니다.
마스터링이 다르다는 얘기는 오디오 포맷 문제를 떠나 동일한 포맷으로 저장한다고 해도 서로 다른 소리가 담긴다는 뜻이므로 엄밀히 말해 비교 대상이 아닙니다.
개인적으로 이소라의 팬으로서 이소라 하차한 후로는 나가수를 전혀 녹화하지 않았고,
인코딩을 한 후 원본 trp 파일을 다 삭제한 터라 지금 하드에 남아있는게 BMK의 아름다운 강산 뿐입니다. (물론 제가 디지탈 튜너로 저장했던 것입니다)
여기서의 비교는 판매용 mp3 음원입니다.
원본 자체의 정보는 다음과 같습니다.
TRP에서 AC3를 추출해내어 WAV로 변환해서 살펴보면...
방송용은 교묘하게 편집을 해버려서 판매용 음원의 러닝타임이 약 4분 50초인 반면 실제 방송에선 약 3분 30초로 1분 가량을 도려낸 상태입니다.
무엇보다 이 둘을 비교하기 힘든 것은 앞서 말씀드린 대로 판매용 음원은 마스터링을 새롭게 했기 때문에 기본적으로 음량 자체가 커진 상태입니다.
방송용 음원도 이미 0dBfs 피크에 도달한 상태이긴 하지만, 판매용은 전체적으로 6dB 정도를 더 키워놓은 상태입니다.
BMK의 파워풀한 공연에서 사실 다이내믹레인지를 따지는게 좀 우습게 느껴지긴 하지만,
방송용 AC3 음원에서는 최소와 최대의 차이가 약 30dB 가량 정도이고
판매용 음원에서는 약 25dB 정도가 차이가 납니다. 이 차이는 최대 음량에서의 차이 때문에 생기는게 아니라 최소음량에서 차이가 나기 때문입니다.
방송용 음원을 앰프의 볼륨을 높여 들으면 비슷하게 들리지만 확실히 볼륨차이로 보기 힘든 밸런스 문제가 생기므로
어느 쪽이 더 좋게 들리느냐는 주관적인 개인 감상이므로 여기서 논하지 않겠습니다.
(애시당초 이 포스팅은 포맷에 관한 것이기 때문에)
어차피 앞서 언급한 대로 둘다 클리핑을 의심할만한 부분이 존재합니다.
녹음이 원래 그런건지 그렇게 믹싱을 한건지는 알 수가 없습니다.
AC3나 시디나 16비트 포맷인 것은 동일하고 음원 자체가 다이내믹레인지의 폭이 좁습니다.
다음으로 샘플링 레이트와 관련해서 인코딩에서 고역 손실이 있는지 여부는 둘다 양호한 상태입니다.
AC3 음원은 이론상으로는 22kHz 이상에서 약간 더 정보를 담을 수 있지만 문제는 인코딩중에서 고역이 먼저 날라갑니다.
보시면 아시겠지만 양쪽 모두 20kHz에서 뚝 떨어져서 21kHz 이상에서는 아무런 정보가 남아있지 않습니다.
(위가 AC3, 아래가 MP3로 AC3를 보면 세로축의 20kHz 위로는 텅 비어있는 걸 볼 수가 있습니다)
다만 방송용 AC3 음원의 경우 TRP 등에서 AC3를 추출할 때 오디오 ID에 따라서 완전히 다른 데이타가 나옵니다.
ID 20에는 비트레이트 448kbps 짜리 2채널 데이타가 들어있고
ID 21에는 비트레이트 192kbps 짜리 2채널 데이타가 들어있습니다.
문제는 흔히 인코딩할 때 사용하는 ID 20의 비트레이트가 더 높은 음원이 인코딩 상태가 더 구리다는 것입니다.
이건 16kHz에서 뚝 떨어져서 고역이 아예 없습니다.
마스터링이 다른 음원들이기 때문에 어느 쪽이 더 좋다고 말하기도 어렵지만
AC3가 시디포맷보다 월등히 좋다고 할만한 이유를 찾을 수가 없습니다.
떨어지는 비트레이트를 차치하고라도 들릴지 안들릴지 모르는, 그리고 음원에 따라 아예 담겨있지도 않는 20kHz 이상의 초고역 때문에 2채널 재생 시스템에서 포맷 측면에서 AC3를 선택할 이유가 없습니다.