Stochastic Differential Equations 공부하기

Central Limit Theorem

Notation

기호의미
번째 독립 확률변수
확률변수의 평균
확률변수의 분산
개 확률변수의 합
표본평균 처음 보는 개념!
표준화된 확률변수
평균 , 분산 인 정규분포
표준정규분포
브라운 운동하는 한 입자의 시간 t에서 위치

Overview

중심극한정리는 확률론과 통계학의 가장 중요한 정리 중 하나로, 많은 독립적인 확률변수들의 합이 정규분포에 수렴한다는 것을 보여준다. 이는 브라운 운동의 이론적 기초이며, 자연현상에서 정규분포가 흔히 나타나는 이유를 설명한다.

Key Points

수가 늘어 나면

  • 평균은 에 선형 증가한다.
  • 분산도 에 선형 증가한다.
  • 표준편차는 법칙을 따른다.
  • 상대표준편차는 법칙을 따른다.

수학적 진술

독립이고 동일한 분포를 가진 확률변수들 에 대해:

  • (평균)
  • (분산)

합을 이라 하고, 표본평균을 이라 하면,
표준화된 분포 은 아래 식으로 나타낼 수 있다.:

일 때, 이면 (표준정규분포)

핵심 스케일링 법칙, 이거라도 알자!

독립 확률변수들의 합에서 나타나는 보편적 패턴:

  • 평균: (선형 증가)
  • 분산: (선형 증가) 브라운 운동의 MSE는 시간에 대해해 선형 증가한다는 것과 연관
  • 표준편차: ( 법칙)
  • 상대표준편차: ( 법칙)

표준화의 의미

표준화 과정의 두 단계:

  1. 중심화: (평균을 0으로)
  2. 스케일 조정: (분산을 1로)

표본평균의 관점에서:

  • (불편 추정량)
  • (정확도가 으로 개선)

구체적 예시: 동전 던지기

번 동전 던지기에서 앞면 개수 :

  • 개별 결과:
  • ,

시행 횟수별 분포:

  • : , 표준편차 = 5
  • : , 표준편차 = 50

상대적 정확도:

  • : 상대 표준편차 =
  • : 상대 표준편차 =

Questions & Insights

왜 정규분포가 등장하는가?

  1. 오차의 상쇄 효과: 큰 값과 작은 값이 서로 상쇄되어 평균으로 회귀
  2. 변동의 감소: 개별 변동들이 만큼만 누적 (선형이 아님)
  3. 자연의 최적성: 주어진 평균과 분산 하에서 엔트로피가 최대인 분포

법칙의 함의

정확도 개선의 한계:

  • 2배 더 정확하려면 4배 더 많은 표본 필요
  • 오차
  • 실용적 한계: 매우 많은 데이터가 필요

표준화 식의 두 가지 표현

첫 번째 형태: 합의 관점 (총합을 표준화)
두 번째 형태: 평균의 관점 (표본평균을 표준화)

References

  • Bernt Øksendal, “Stochastic Differential Equations”, Chapter 2
  • 중심극한정리와 브라운 운동의 연결
  • 물리적 해석: 분자 충돌의 누적 효과

Notes from Claude

브라운 운동과의 연결

브라운 운동에서 입자에 가해지는 수많은 미시적 충격들:

  • 각 충격 = 독립적인 확률변수
  • 시간 간격 동안의 위치 변화 = 많은 충돌의 합
  • 중심극한정리 적용 →

물리적 의미:

  • 복잡한 미시적 과정 → 간단한 거시적 법칙 (정규분포)
  • 이것이 통계물리학의 핵심 아이디어

스케일링과 자기유사성

브라운 운동의 스케일링 성질:

이는 중심극한정리의 법칙과 직접 연결됨:

  • 시간이 4배 → 분산이 4배 → 표준편차는 2배
  • 자연의 프랙탈 구조와 연결

실용적 활용

  1. 품질 관리: 제품 측정값들의 평균 분포
  2. 여론조사: 표본평균의 신뢰구간 계산
  3. 금융: 주가 수익률의 분포 모델링
  4. 물리학: 측정 오차의 분포, 통계역학의 열평형

중심극한정리는 단순한 수학 정리를 넘어서 자연현상을 이해하는 핵심 도구이다.