← 저널작업 노트

AI 사운드가 99%까지 왔는데, 나머지 1%가 몰입을 만듭니다 — 공간감 편

2026.04.25 · 4분 읽기

AI로 만든 영상 사운드, 왜 어색할까요? 공간감 문제 3가지와 수정 방법을 실제 영상으로 비교해드립니다. Seedance 영상 분석.

AI 사운드가 99%까지 왔는데, 나머지 1%가 몰입을 만듭니다 — 공간감 편

AI가 만든 영상의 사운드, 요즘 정말 많이 좋아졌어요.

처음 들으면 "이 정도면 됐지"라는 생각이 들 만큼요.

오늘은 Seedance 2.0으로 생성한 영상의 사운드를 분석하면서 발견한 세 가지 문제를 공유할게요. 주제는 '공간감'입니다.

먼저 영상을 들어보세요.

POINT 1. 같은 발소리가 첫번째 컷과 두번째 컷에서 반복됩니다

실제 공간에서 걷는 소리는 컷이 바뀔 때마다 달라져야 합니다. 카메라 앵글이 바뀌면 거리가 달라지고, 거리가 달라지면 소리의 크기와 질감이 달라져요.

AI는 하나의 발소리 샘플을 첫번째 컷과 두번째 컷에 동일하게 사용했습니다. 거리감을 주었기 때문에 처음에는 알아챌 수 없을 수 있겠지만, 몇 번 들으니 들립니다. 수정 방법은 간단합니다. 컷마다 다른 리소스를 쓰는 것. 또한 같은 신발이라도 카메라와의 거리, 바닥 재질의 반사에 따라 소리가 달라지게 디자인해야합니다.

POINT 2. 멀어져도 음색이 그대로입니다

소리는 거리가 멀어질수록 고음이 먼저 사라집니다. 이걸 사운드 작업에서는 하이컷 필터라고 불러요.

AI 사운드에는 이 처리가 없습니다. 캐릭터가 멀리 있는 컷에서도 가까이 있는 컷과 음색이 동일해요. 볼륨 처리로 거리감을 만들었지만 음색은 그대로였습니다.

POINT 3. 환경음이 모노입니다

공간감을 만드는 데 가장 결정적인 요소는 사실 환경음, 즉 앰비언스입니다.

영상에서 표현할 수 있는 실제 공간의 앰비언스는 스테레오예요. 왼쪽에서 들리는 소리와 오른쪽에서 들리는 소리가 다릅니다. 바람 소리, 사람들의 웅성거림 등 공간 전체에서 방향을 가지고 들려와야 비로소 '그 공간에 있다'는 느낌이 납니다.

AI가 생성한 환경음은 모노가 많아요. 방향성이 없습니다. 그래서 화면은 넓게 펼쳐져 있는데 소리는 정면에서만 들리는 이상한 상태가 됩니다.

환경음을 스테레오로 교체하는 것만으로 공간감이 눈에 띄게 달라집니다.

수정 후 — 직접 들어보세요

발소리 리소스 교체, 거리별 하이컷 필터 적용 및 리버브 양 조정, 환경음 스테레오 변환. 이 세 가지만 적용했습니다.

정리하면

공간감은 가장 무의식적으로 느끼는 사운드 요소입니다.

발소리가 컷마다 똑같다 (리소스 반복)

멀어져도 음색이 그대로다 (거리별 하이컷 처리 부재)

환경음이 방향이 없다 (모노 앰비언스)

이 세 가지가 합쳐지면 화면은 그럴듯한데 왠지 모르게 가짜 같은 느낌이 만들어집니다. 그 '1%'의 정체가 바로 여기 있어요.

AI 사운드가 99%까지 왔는데, 나머지 1%가 몰입을 만듭니다 — 공간감 편

다른 글

AI 사운드, 프로의 귀에는 여기서 걸립니다 — 4가지 포인트