본문 바로가기
수학

확률 모델링 및 베이지안 학습의 수식 | 인공지능 세특

by 여행과 수학 2024. 11. 4.
반응형

확률과 통계는 인공지능에서 불확실한 데이터를 처리하고, 모델을 학습하는 데 필수적인 역할을 합니다. 특히, 확률 모델링과 베이지안 학습은 데이터를 기반으로 예측을 수행하고, 새로운 정보가 주어질 때 기존 예측을 업데이트하는 데 사용됩니다. 베이지안 학습은 베이즈 정리를 기반으로 하며, 조건부 확률을 통해 모델의 사후 확률을 계산합니다. 이 글에서는 확률 모델링과 베이지안 학습의 구체적인 수식을 살펴보고, 이를 인공지능에서 어떻게 활용하는지 설명하겠습니다.

1. 확률 모델링의 기본 개념

확률 모델링은 데이터가 특정 확률 분포를 따른다고 가정하고, 이를 기반으로 예측과 추론을 수행하는 방식입니다. 확률 모델은 데이터의 불확실성을 표현하며, 여러 확률 분포(정규분포, 베르누이 분포 등)를 사용해 모델링합니다. 확률 밀도 함수(PDF)는 연속형 확률 분포에서 특정 값이 나올 확률을 나타내며, 이산형 확률 분포에서는 확률 질량 함수(PMF)를 사용합니다.

1.1 확률 밀도 함수(PDF)의 수식

연속 확률 변수 \(X\)가 특정 분포(예: 정규분포)를 따를 때, 확률 밀도 함수(PDF)는 다음과 같이 정의됩니다:

\[ f_X(x) = \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}} \]

여기서:

  • \(f_X(x)\): 확률 밀도 함수(PDF)
  • \(\mu\): 평균
  • \(\sigma^2\): 분산

이 수식은 정규분포에서 사용되는 확률 밀도 함수로, 변수 \(x\)가 평균 \(\mu\)와 분산 \(\sigma^2\)를 가진 정규분포를 따를 때 해당 값을 계산합니다.

1.2 확률 질량 함수(PMF)의 수식

이산 확률 변수 \(X\)가 특정 값 \(x_i\)를 가질 확률은 확률 질량 함수(PMF)를 사용해 나타낼 수 있습니다. 예를 들어, 베르누이 분포를 따르는 확률 변수의 PMF는 다음과 같이 정의됩니다:

\[ P(X = x_i) = p^{x_i} (1 - p)^{1 - x_i} \]

여기서:

  • \(p\): 사건이 일어날 확률
  • \(x_i \in \{0, 1\}\): 이산 확률 변수의 값

베르누이 분포에서는 이산 확률 변수 \(X\)가 0 또는 1의 값을 가지며, 각각의 확률은 \(p\)와 \(1 - p\)로 나타낼 수 있습니다.

2. 베이지안 학습(Bayesian Learning)

베이지안 학습은 데이터로부터 사전 확률을 업데이트하여 사후 확률을 계산하는 학습 방법입니다. 베이즈 정리를 바탕으로 새로운 데이터가 주어졌을 때 기존의 신념(사전 확률)을 업데이트하여 더 정확한 예측을 할 수 있게 합니다. 베이즈 정리의 수식은 다음과 같습니다:

2.1 베이즈 정리의 수식

베이즈 정리는 다음과 같은 수식으로 표현됩니다:

\[ P(H | D) = \frac{P(D | H) P(H)}{P(D)} \]

여기서:

  • \(P(H | D)\): 데이터 \(D\)가 주어졌을 때 가설 \(H\)가 참일 확률(사후 확률)
  • \(P(D | H)\): 가설 \(H\)가 참일 때 데이터 \(D\)가 관찰될 확률(가능도, Likelihood)
  • \(P(H)\): 가설 \(H\)가 참일 확률(사전 확률)
  • \(P(D)\): 데이터 \(D\)가 관찰될 확률(증거)

베이즈 정리를 통해 데이터 \(D\)가 주어졌을 때 가설 \(H\)의 사후 확률 \(P(H | D)\)를 계산할 수 있습니다. 이 수식은 기존의 사전 확률 \(P(H)\)에 데이터를 반영하여 업데이트하는 과정입니다.

2.2 베이지안 학습의 과정

베이지안 학습의 과정은 크게 사전 확률(Prior), 가능도(Likelihood), 사후 확률(Posterior) 세 단계로 이루어집니다. 새로운 데이터가 주어질 때마다 베이즈 정리를 이용하여 사후 확률을 계산하고, 그 결과를 다음 학습 단계의 사전 확률로 사용합니다. 이 과정은 다음과 같이 요약됩니다:

  • 사전 확률 \(P(H)\): 가설 \(H\)에 대한 초기 신념
  • 가능도 \(P(D | H)\): 가설 \(H\)가 참일 때 데이터 \(D\)가 발생할 확률
  • 사후 확률 \(P(H | D)\): 데이터를 반영한 후 가설 \(H\)가 참일 확률

예를 들어, 스팸 필터링 문제에서 베이지안 학습을 적용해보면, 사전 확률은 이메일이 스팸일 가능성에 대한 초기 추정값이고, 가능도는 특정 단어가 이메일에 등장할 확률을 의미합니다. 데이터를 학습함에 따라 스팸 이메일과 정상 이메일 간의 구분이 더 명확해지며, 사후 확률을 통해 새로운 이메일이 스팸일 확률을 추론할 수 있습니다.

2.3 베이즈 정리의 예시: 스팸 필터링

스팸 필터링 문제에서, 이메일에 특정 단어 \(x\)가 포함되었을 때 그 이메일이 스팸일 확률을 구하는 방법을 살펴보겠습니다. 베이즈 정리를 사용하여 다음과 같이 계산할 수 있습니다:

\[ P(\text{Spam} | x) = \frac{P(x | \text{Spam}) P(\text{Spam})}{P(x)} \]

여기서:

  • \(P(\text{Spam} | x)\): 단어 \(x\)가 주어졌을 때 이메일이 스팸일 확률(사후 확률)
  • \(P(x | \text{Spam})\): 이메일이 스팸일 때 단어 \(x\)가 등장할 확률(가능도)
  • \(P(\text{Spam})\): 이메일이 스팸일 확률(사전 확률)
  • \(P(x)\): 단어 \(x\)가 등장할 확률(증거)

이 수식을 통해 이메일의 단어 패턴을 분석하고, 새로운 이메일이 스팸일 확률을 추론할 수 있습니다. 데이터를 학습할수록 사후 확률은 더욱 정교해지며, 스팸 필터링 성능이 향상됩니다.

결론

확률과 통계는 인공지능의 다양한 영역에서 데이터의 불확실성을 처리하고, 모델을 학습하는 데 중요한 역할을 합니다. 확률 모델링을 통해 데이터의 분포를 추정하고, 베이지안 학습을 통해 사전 지식을 데이터로 업데이트하면서 보다 정확한 예측을 할 수 있습니다. 베이지안 학습은 사전 확률, 가능도, 사후 확률의 관계를 이용하여 새로운 정보가 주어질 때 기존의 신념을 효과적으로 갱신하는 방법을 제공합니다.

이러한 수학적 기법들은 스팸 필터링, 추천 시스템, 이미지 분류와 같은 다양한 인공지능 문제를 해결하는 데 필수적으로 사용되며, 데이터가 많아질수록 더욱 정밀한 예측과 성능을 발휘할 수 있습니다.

 

수학의 실생활 적용 분야 알아보기 | 공학 건축 컴퓨터 금융

수학은 교실에서 가르치는 과목 그 이상입니다. 일상 생활의 모든 측면에 스며드는 근본적인 도구입니다. 간단한 계산에서 복잡한 모델링에 이르기까지 수학은 실제 문제를 해결하고 과학, 기

mathtravel.tistory.com

 

728x90

댓글