걍블로그
연속확률분포의 평균과 분산 본문
개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다.
----------------------------------------------------------------------------------------------------
이제 연속 확률변수에 대해서 알아보자. 가장 먼저 일반화 분포인 감마분포에 대해서 알아보자. 일단 감마분포의 확률의 모양부터 생각해 보자. (감마함수는 팩토리얼을 표현하기 위한 함수 꼴에서(대충 e를 포함하고 부정적분을 적용하게 될 형태쯤 되겠지!) 합이 1이 되기 위해서 감마함수를 다시 나눈 형태)
가 된다. 여기서 베타부분을 추가해서 x에 대한 분포의 스케일을 조절해 주자(알파는 형태를 결정, 베타는 스케일을 조절 해준다. 알파와 베타가 x에 대하여 어디쯤 위치에 있는지 보면 이해할 수 있다.). 그러면 아래와 같이 표현 가능하다.
이제 이로부터 기댓값을 찾아보자. 식을 전개하는 과정은 이전과 같다. X를 지워주고, 우리가 원하는 확률분포의 꼴에 맞춰주면 된다(사실 여기서는 감마분포가 아니라 감마 함수지만, 그래도 기본적으로 식을 전개하는 방향은 같다고 봐도 무방할듯!).
여기서 우리는 적분을 편하게 하기 위해서 간단한 치환을 해보자
라고 가정하자.
이제 우리에게 익숙한 형태로 모양을 바꿔보자.(적분에 상관없는 부분 빼내자)
이때,
이기 때문에 이제 이를 풀어보면,
가 된다. 이때 감마함수의 의미가 팩토리얼 함수임을 생각해보면 우리는
라는 결론을 얻을 수 있다. 여기서 흥미로운 사실은 감마분포가 일반화의 성질을 가진 분포이기 때문에 이와 연관된 분포들의 평균과 분산을 찾을 수 있다는 것이다.
카이제곱분포는
의 감마함수이기 때문에(이때, v는 자유도), 평균은
가 된다. 그리고 지수분포는
인 감마분포이기 때문에(이때, 람다는 포아송분포에서의 람다를 의미), 평균은
가 된다. 위의 가정(알파 = 1)을 역으로 생각하면
라면, k번의 발생이 일어날 때까지의 시간에 대한 분포를 감마분포라고 생각할 수도 있다. 따라서 감마분포를 지수분포 일반화 했다고 봐도 될 것이다. (하지만 개인적으로 좋은 해석인지는 잘 모르겠다. 감마분포는 대부분의 연속분포들에 대한 일반화된 모양을 가지는 것이라는 해석이 더 적절하다고 개인적으로 생각함)
이제 감마분포의 분산에 대해서 계산해 보자. 계산을 위해서 이전에 계속 사용하던 아이디어를 이용할 것이다. 따라서
에 대해서 먼저 계산 할 것이다. 마찬가지로
를 가정하여
가 된다. 이제 이를 간략히 하면,
가 되고,
이기 때문에
가 된다. 이제 여기서
가 된다. 이제 다시 다른 분포로 확장해보면,
카이제곱분포는
의 감마함수이기 때문에(이때, v는 자유도), 분산은
가 된다. 그리고 지수분포는
인 감마분포이기 때문에(이때, 람다는 포아송분포에서의 람다를 의미), 분산은
가 된다.
이제 적률생성함수에 대해서 알아보자. 역시 기본적인 정의
에서부터 출발하자. 여기서도 일단 식을 간단하게 표현해 보자. (가장 기본은 비슷한 대상끼리 뭉치기!)
이제 여기서 우리의 목적을 위해 식을 간단히 표현 해보자. (지수함수 부분을 간편하게 치환하는 방식이 제일 효과적일거라 생각한다) 즉,
로 치환하여 식을 전개해보자.
이 된다. 이제 이전과 마찬가지로, 그리고 지수분포는
을 대입하기 때문에,
가 된다. 카이제곱분포는
의 감마함수이기 때문에(이때, v는 자유도)
가 된다.
이제는 다른 일반화 분포인 베타분포에 대해서 알아보자. 일단 기본적인 확률분포의 정의는 다음과 같다.
이제 이로부터 평균을 정의부터 시작하여 유도해보자.
이제, 이전처럼 우리가 원하는 꼴로 식을 변형해보자.(보통 우리가 원하는 꼴이라고 한다면, 일반적으로 주어진 정보들일 확률이 높다. 즉, 여기서는 베타분포나 베타함수를 의미한다)
이제 분산을 구해보자. 이전에 사용하던 분산을 구하는 아이디어를 사용하자.
이제 이를 다시 우리가 원하는 모양으로 전개해보자.
가 되기 때문에
이 된다. 이를 풀면,
가 된다. 적률생성함수는….. 직관적인 느낌으로 이해가 잘 안된다…. 좀 더 공부해야겠다….ㅠㅜ
이제 다음은 정규분포에 대해서 생각해보자. 사실 정규분포의 평균은 직관적으로 이해할 수 있다. 왜냐면 분포가 대칭이기 때문에 여기에 기준이 되는 지점이 평균이다. 우리는 기존에는 평균을 구하기 위해서
의 관점으로 평균을 찾아 내었다. 하지만 정규분포를 이런 관점으로 접근하게 된다면,
을 우리가 원하는 확률분포 꼴로 푼다면….
꼴이 될 것이다. 지수에 로그까지 있는 다루기 꽤 복잡해 보인다…… 그래서! 그냥 정규분포는 mgf를 구해서 이에 대한 미분으로 평균과 분산을 구하자! (우리는 이럴 때 적용하기 위해서 mgf의 개념을 익힌 것이 아닐까? 라고 생각이 들었다. 그럼 mgf를 구해보자.
이도 마찬가지로 exp(tX)를 합쳐주고, 수식을 우리가 원하는 모양으로 다시 변형하면,
가 된다. 여기서 확률분포의 성질에 의해서
이기 때문에 mgf는
가 된다. 우리는 이제 여기에 대한 1차 미분과 2차 미분을 구해서 평균과 분산을 구하자.
에서 t=0일 때,
가 되기 때문에
가 된다. 2차 미분에서 t=0이면,
가 된다. 따라서
이기 때문에, 분산은
가 된다.
'수학 > 통계' 카테고리의 다른 글
음이항분포와 초기하분포의 평균과 분산에 대하여 (0) | 2021.03.29 |
---|---|
평균과 적률생성함수의 관계(2) (0) | 2021.03.28 |
평균과 적률생성함수의 관계(1) (0) | 2021.03.24 |
적률생성함수 (0) | 2021.03.16 |
확률분포(2) (0) | 2021.03.15 |