Generalized Central Limit Theorem Proof

Overview

여러 단계의 시행 결과를 모두 더한 변수는 Gaussian distribution을 따른다는 정리.
비록 각 시행의 확률 분포는 매우 다를지라도 이런 성질을 만족한다.

Characteristic function을 이용한 일반화된 중심극한정리(CLT) 증명을 다룬다. 여기서 “일반화”란 각 step의 크기가 다를 수 있고(), 평균이 0이 아닐 수 있다(, biased random walk)는 의미다.

이 증명은 W. Sung의 “Statistical Physics for Biological Matter” Chapter 10에 기반하며, 책의 오타를 수정한 버전이다.

Symbol Table

SymbolMeaning
번째 step의 변위 벡터
End-to-end distance,
번째 step의 확률분포
의 characteristic function (Fourier transform)
번째 step의 평균
번째 step의 분산,
전체 step 평균의 평균,
전체 분산의 평균,

Key Points

Step 1: End-to-End Distance의 확률분포

개의 독립적인 step으로 이루어진 random walk의 end-to-end distance 의 확률분포는:

Step 2: Fourier 표현

델타함수의 Fourier 표현, constant를 푸리에변환하면 디락 델타가 나온다.

이를 대입하면:

여기서 characteristic function은:
개별 시행의 확률 분포를 푸리에 변환한 것
확률을 푸리에 변환하면 푸변에서 사용하는 exponential에 대한 평균값이 나온다.

Step 3: Characteristic Function의 전개

을 Taylor 전개하면:

앙상블 평균을 취하면:

주의: 책(식 10.13)에서는 마지막 항이 로 되어 있는데, 이는 오타다. 올바른 형태는 이다.

Step 4: 로그를 취하고 전개

곱의 로그는 로그의 합:

(for small )를 적용:

Step 5: Isotropic 분포에서 계산

Isotropic(등방성) 분포에서는 이므로:

이 작다고 가정하면 이므로:

Step 6: 합 계산

전체 평균을 정의하면:

따라서:

Step 7: 단일 step의 Characteristic Function 형태

그러면:

Step 8: Fourier 역변환으로 Gaussian 복원

식 (12)를 식 (3)에 대입하고 Fourier 역변환을 수행하면:

여기서:

Questions & Insights

  • 일반성: 개별 step의 분포 가 무엇이든, 통계적으로 독립이기만 하면 에서 Gaussian 분포가 된다.
  • 책의 오타: 식 10.13의 첫 번째 줄에서 의 오타다. 전자를 사용하면 분산 항이 상쇄되어 CLT의 핵심인 항이 사라져버린다.
  • Isotropic 가정: 식 (7)에서 는 등방성 가정이 필요하다. 비등방성 분포에서는 더 복잡한 텐서 구조가 나타난다.

References

Notes from Claude

이 증명의 핵심은 characteristic function의 곱이 로그에서 합으로 바뀐다는 점이다. 이 덕분에 개별 step들의 기여가 단순히 더해지고, 이 커지면 중심극한정리에 의해 Gaussian으로 수렴한다.

물리적으로, 이것은 많은 독립적인 작은 요동들이 합쳐지면 그 분포가 원래 요동의 세부사항과 무관하게 Gaussian이 된다는 보편성(universality)을 수학적으로 보여준다. 이것이 자연에서 Gaussian 분포가 그토록 흔한 이유다.