본문 바로가기

대학원 공부/확률과 통계

정규분포(6-1강)

정규분포의 정의와 활용예에 대하여 이해한다.

 

1. 정규분포(Normal Distribution (Gaussian))의 X의 의미와 fx(x)를 적고 그래프를 그린 뒤 σx와 그래프와의 관계에 대해 서술하여라

 1.1 -∞~∞까지 정규분포 식을 적분하여라

 1.2 이중적분을 간단히 설명하여라

 1.3 자코비안 매트릭스가 무엇인지 간단히 서술하여라 

 1.4 정규분포식을 -∞~x까지 적분하여라

 1.5 lookup table이 무엇인지, 어디에 쓰는 지 서술하여라

 1.6 정규분포 식의 형태 X = N(a;b)에서 a와 b가 의미하는 것은?

 

2. 10번 혹은 20번 이상 시도해서 성공한 횟수를 Z를 이용하여 간단히 나타내어라

#Binomial Distribution to Normal Distribution

 

3. Error Function과 Complementary error function의 의미?

 

4. Pascal(Negative Binomial) Distribution의 X, P(X), E[Xk], E[Xk^2]은?

 4.1.Geometric Distribution의 차이점은? 

 


1. 정규분포(Normal Distribution (Gaussian))의 X의 의미와 fx(x)를 적고 그래프를 그린 뒤 σx와 그래프와의 관계에 대해 서술하여라

X: 일반적인 경우들을 위한 연속하는 RVs

예를 들어, 이미지 센서, 오디오 신호, 모바일 채널등에서 발생하는 노이즈는 가우시안 분포로 처리한다.

정규분포 그래프는 bell-shaped, symmetric, single-mode(mode: 극댓값)의 특성을 띈다. 

 

대부분의 노이즈가 왔다갔다하기에 합치면 평균이 0이 된다.

이 종모양의 정규분포 그래프의 분산도는 σ^2과 비례하는데

σ가 커지면 벨모양 부분이 넓어지고

σ가 작아지면 평균값 기준으로 상대적으로 큰값들이 발생할 가능성이 올라간다.

 

 

1.1 정규분포 식을 적분하여라

 -∞~∞까지

 

 

1.2. 이중적분을 간단히 설명하여라

하나짜리 적분은 dx로 잘려진 x가 각각 y에 대해 가지는 넓이들을 전부다 더하는 것

이중적분은 dx*dy 면적으로 잘려진 것이 가지는 각각의 높이를 곱하여 부피를 더하는 것 

"면적x높이를 모든 구간에 대해 더해나가는 것"

 

1.3. 자코비안 매트릭스가 무엇인지 간단히 서술하여라 

면적 혹은 차수가 하나 더 늘어나 부피가 될 경우, 이러한 것들을 면적에 동일한 비율이 되도록 변환시켜주는 파라미터

 

1.4. 정규분포식을 -∞~x까지 적분하여라

 

5와 5-1 설명

1.5. lookup table이 무엇인지, 어디에 쓰는 지 서술하여라

 

x = (x - μx)/σ

Φ(x) = Pz(z<=x)

평균은 0, 분산은 1인 정규분포를 갖는 확률변수 X에 대해서 -∞ ~ x 까지의 확률

 

특징

이 테이블을 사용하면, 어떤 평균과 분산을 갖는 정규분포든지 간에 다 (x-μx)/σ로 변환해서 그 값에 대응하는 표준정규 분포표의 값으로 확률표를 보고 구할 수 있다.

 

그리고 좌우대칭이기에 Φ(x) + Φ(-x) = 1이라는 공식을 이용할 수도 있다.

 

 

 

https://en.wikipedia.org/wiki/Standard_normal_table

 

Standard normal table - Wikipedia

A standard normal table, also called the unit normal table or Z table[1], is a mathematical table for the values of Φ, which are the values of the cumulative distribution function of the normal distribution. It is used to find the probability that a stati

en.wikipedia.org

 1.6 정규분포 식의 형태 X = N(a;b)에서 a와 b가 의미하는 것은?

X = N(a; b)

예를 들어 N(3; 9)는

평균 3, 분산의 제곱 9를 갖는 정규분포를 뜻한다.

즉, 평균3, 분산3 이라는 것!

 

2. 10번 혹은 20번 이상 시도해서 성공한 횟수를 Z를 이용하여 간단히 나타내어라

B(n; p) -> N(np; np(1-p))

n번 시행해서 p라는 성공확률이 몇번 나오냐

 

n을 여러번 시행한 것의 횟수를 더하면, ∑(a부터 b까지)nCp*P^x*(1-P)^(n-x)인데 n이 커지면 커질수록 정규분포형태에 가깝게 된다. 그래서 10번이상 20번 이상 시도할경우, 정규분포로 바꿀 수 있다.

 

3. Error Function과 Complementary error function의 의미?

Error Function은 정규분포합(0~x)에 두배를 해준 것이다. erf(x)로 나타낸다.

오차 함수(error function)

Complementary error function은 나머지 부분(x~∞)을 나타낸 것이다. erfc(x)로 나타낸다.

여오차함수(complementary error function)

 

오차함수는 정규 분포 누적분포함수와 본질적으로 동일하다. Φ라고 쓰며 상수배하거나 평행이동하는 차이 밖에 없다.

 

4. Pascal Distribution = Negative Binomial Distribution (음이항분포)

X: K번 성공할 때 까지 던진 횟수

P(X=n) = n-1Ck-1 P^(k-1)*(1-P)^(n-k)*P

Fx(X) = ∑(n=k ~ ∞) n-1Ck-1 q^(n-k) 

(1-P = q)

 

E[Xk] = k/P

E[Xk^2] = (k^2+k(1-P))/P^2

σ^2 = k(1-P)/P

 

음이항분포(Pascal Distribution) P(X)

 

4.1.Geometric Distribution은 첫번째 성공을 하기까지 시행해야하는 횟수 n번을 말한다.

그래서 위 P(X)식에서 k가 1이 된다면, Geometric Distribution과 같아지는 것

 

강의 출처:

http://www.kocw.net/home/search/kemView.do?kemId=1056974