걍블로그
확률분포(1) 본문
개인적으로 이해한 내용을 정리한 부분이라서 틀린 부분이 있을 수 있음을 양해해주시기 바랍니다
------------------------------------------------------------------------------------------------------------------
이번 시간에는 다양한 확률 분포에 대해서 알아보자.
가장 기본적인 확률 분포는 베르누이분포이다. (개인적인 생각으로 확률 분포를 만들기 위해서는 확률 변수가 어떤 상황을 나타내는지가 매우 중요하다고 생각한다) 베르누이분포는 (성공/실패)의 두 가지 중에서 하나를 선택하기 위한 확률 분포이다. 따라서 성공의 확률을 p라고 하면 실패의 확률을 1-p가 되고 이를 수식으로 종합하면,
로 표현이 가능하다. (이전에도 언급했듯이 X와 x는 다른 의미를 지닌다. X는 random variable로 특정 사건들의 집합으로부터 실수로의 mapping(함수)을 의미하고, x는 임의의 특정 지점에서의 상수를 의미한다.)
이에 대한 확장이 이항분포이다. 이항분포는 베르누이분포를 n번 독립적으로 시행해서 나온 결과를 의미한다. 따라서
꼴의 형태가 나타나고, 이제 경우의 수를 곱하여서
가 된다. 표기법으로는
로 표현한다.
기하분포는 이항분포의 특별한 경우인데, 처음 성공이 나올 때까지의 확률을 표현한다. 만약 k번째 성공이 일어난다면 k-1번의 실패가 일어나야만 하고, 성공이 일어나면, 시행이 종료되기 때문에 각각의 k에 대한 사건은 1개만 존재하고 경우의 수는 1이된다. 따라서
이 된다.
음이항분포는 기하분포의 확장된 개념으로 볼 수 있다. 이제는 성공이 k개 나오는 상황을 표현한다. 전체 시행횟수를 x라고 한다면(즉 음이항 분포의 의미는 'k번 성공을 하기 위해서 몇번의 시도를 해야하는가'의 의미로 해석 할 수 있다), k-1개의 성공이 나올 때까지는 기존의 이항분포와 동일하다. 단, 맨 마지막이 무조건 성공이 되어야 하기 때문에 경우의 수를 구할 때 n-1에 대하여 계산한다. k-1번의 성공이 나온 이후로는 기하분포를 따르기 때문에 이를 종합하여 수식으로 나타내면
가 된다. 이를 표기법으로 표현하면
이 된다.
초기하분포는 서로 다른 그룹에서의 선택에 대한 확률이다. r개의 원소로 이뤄진 하나의 그룹과 n-r개로 이뤄진 다른 그룹에서 m개를 선택할 확률을 구하는 상황이다. 이때, 우리가 생각해볼 개념으로 확률에 대한 정의로 (해당 경우의 수/전체 경우의 수)를 생각할 수 있을 것이다. (확률에 대한 정의가 나중에는 더 엄밀해 지지만, 여기서는 간략하게 생각하자) 전체 원소 n개에서 m개를 뽑을 경우의 수와 각각의 그룹에서 k, m-k개의 원소를 뽑을 경우의 수를 계산하면
로 표현이 가능하다.
이산형 변수의 마지막 분포로 포아송분포가 있다. 포아송분포의 상황은 어떤 단위시간에 일이 일어날 확률이 아주 적은 경우의 이항분포이다(이항분포의 극한 정도의 개념으로 생각하면 될 것 같다). 어떤 단위시간에 평균적으로 몇 번의 사건이 일어나는지에 대한 정보를 바탕으로 확률 분포를 나타낼 수 있다. 포아송분포와 이항분포의 상황의 차이는 우리는 n과 p를 알수 없고, 단지 평균만 알 수 있다는 차이가 있다.
로 평균을 정의하고, 이를 이항분포의 공식에 대입해 보자.
로 표현이 가능하다. 이제, 우리의 가정은 n이 무수히 큰 경우를 보기 때문에, n에 대한 극한을 취했을 때 값을 수렴 할 수 있어야 하고 따라서 n!에 대하여서 n의 차수를 맞춰주기 위해서 식을 조금 수정하자.
이제 n이 극한으로 가게 되면,
이 된다. 이제 여기서 n이 극한으로 가게 되면,
가 됨을 가정하여서,
로 표현하자. 이제 식을 종합하면,
된다. 포아송분포는 단위시간의 평균 사건 발생 횟수를 알 때 주로 사용되는 확률분포이다.
표기법으로는
로 표현한다. 이때 단위 시간당 발생하는 사건의 수가 포아송분포
를 따를 때, t시간 동안 발생하는 사건의 수는
확률분포를 따른다.
이제 연속형 확률변수의 가장 기본적인 분포인 균일 분포에 대해서 알아보자. 균일 분포는 말 그대로 모든 확률이 균일한 분포를 가지는 것이다. 따라서 균일 분포의 확률은 1을 구간에서 나눈 값이 된다. 즉,
가 된다. 여기서 b,a는 군포의 양 끝 지점을 의미한다.
'수학 > 통계' 카테고리의 다른 글
평균과 적률생성함수의 관계(2) (0) | 2021.03.28 |
---|---|
평균과 적률생성함수의 관계(1) (0) | 2021.03.24 |
적률생성함수 (0) | 2021.03.16 |
확률분포(2) (0) | 2021.03.15 |
변수변환 (0) | 2021.03.12 |