audio_background AI audio sampling frequency amplitude bitdepth waveform

오디오 데이터(소리)의 기본 개념: 샘플링 / 샘플링 속도 / 주파수 / 진동 / 진폭 / 비트뎁스 / 파형

Kwangjin Park

Aug 12, 2025 · 1 min read

Follow

1. 소리가 디지털 신호가 되는 과정

소리란?

  • 공기 압력의 진동
  • 사람이 말하거나 악기가 울리면 → 공기가 밀리고 벌어지며 파동 형성
  • 본질적으로 음파는? → 연속적인 신호

아날로그에서 디지털로 변환(via 샘플링 및 양자화)

  • 디지털 기기에서 소리를 처리하기 위해서는 반드시 디지털 표현으로 변환되어야 함 → 음파는 연속적인 신호인 반면, ==디지털 기기들은 유한개의 값들을 요구==하기 때문
  • 우선 아날로그 신호는 마이크에 의해 입력되어 음파에서 전기 신호로 변환됨
  • 이 전기 신호가 아날로그-디지털 컨버터를 거치며 샘플링을 통해 디지털 표현으로 변환
  • 샘플링(Sampling)
    • 연속적인 신호를 고정된 시간 간격으로 측정하는 과정
    • 공기의 압력 변화(소리의 입력)를 아주 짧은 시간 간격(예: CD 품질의 audio → 1/44,100초)마다 “공기의 압력 변화(=순간의 소리 크기)”를 측정해 숫자로 기록
    • 소리의 진폭: 특정 순간 소리의 압력 수준(단위: dB)
  • 파형(waveform)의 생성
    • 샘플링된 샘플들은 균일한 간격으로 파형을 이룸
    • 파형은 유한개의 신호 값을 지님 → “Discrete”
      • 예) 1초 동안 44,100번 측정 → 44,100개의 숫자로 소리 기록

2. 샘플링 속도와 비트뎁스

  • 샘플링 속도(Sampling rate, 샘플링 주파수)
    • 1초동안 수집된 샘플의 수(단위: Hz)
      • 예: CD 품질의 audio → 1/44,100초 간격으로 샘플링 → 44,100Hz의 샘플링 속도
    • 샘플링 속도는 신호에서 얼마나 큰 주파수까지 잡아낼 수 있는지 결정하는데 큰 역할 image1
    • 신호에서 캡처가능한 최고 주파수의 한계는 샘플링 속도의 정확히 절반 → “나이퀴스트 한계”
    • 나이퀴스트 한계(Nyquist limit)
      • 인간이 들을 수 있는 소리의 최대 주파수 → “약 20kHz”
      • 나이퀴스트 샘플링 이론에 따르면, 어떤 신호도 ==최대 주파수의 두 배 이상 샘플링== 해야 정보를 잃지 않고 복원 가능 → 최대 20kHz 주파수를 정확히 포착하려면 ==최소 40kHz 이상== 샘플링 해야함
      • 44.1kHz는 이 기준을 충족하면서 마진을 두어 22.05kHz까지 정확한 복원이 가능하게 만든 Sampling rate
  • 비트 뎁스
    • 연속적인 음파를 얼마나 정밀하게 기록할지 결정하는 척도
      • n비트의 정밀도: $2^n$
    • 각 오디오 샘플이 기록하는 오디오 파동의 진폭을 기록하는 정밀도를 결정
      • 컴퓨터는 무한한 값의 범위를 모두 저장할 수 없음
      • 전체 샘플의 진폭 값의 범위에 대해, 비트 뎁스(16비트, 24비트)에 따라 정해진 단계 수로 나누어줌
      • 각각 측정된 진폭값에 대해, 비트 뎁스로 인해 단계별로 분할된 값 중 가장 가까운 값에 맞추어 반올림해 저장
    • 비트 뎁스가 높을 수록 음파를 표현하는 디지털 표현이 기존 음파에 더 가까워짐
chat_bubble 0

chat_bubble 댓글남기기

댓글남기기