목록수학/통계 (8)
걍블로그

개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다. ---------------------------------------------------------------------------------------------------- 이제 연속 확률변수에 대해서 알아보자. 가장 먼저 일반화 분포인 감마분포에 대해서 알아보자. 일단 감마분포의 확률의 모양부터 생각해 보자. (감마함수는 팩토리얼을 표현하기 위한 함수 꼴에서(대충 e를 포함하고 부정적분을 적용하게 될 형태쯤 되겠지!) 합이 1이 되기 위해서 감마함수를 다시 나눈 형태) 가 된다. 여기서 베타부분을 추가해서 x에 대한 분포의 스케일을 조절해 주자(알파는 형태를 결정, 베타는 스케일을 조절 해준다. 알..

개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다. ---------------------------------------------------------------------------------------------------- 이번에는 음이항분포에 대해서 알아보자. 기본적인 정의에 의해서 로 표현 할 수 있다. 하지만 이때 문제가 있는데….. 우리는 이전에 사용했던 기본 원칙을 적용하기가 힘들다(왜냐면 이전에는 x가 분모 부분과 연관되어 사라졌는데 여기서는 분자와 연관이 되어 있다). 따라서 우리는 기존의 음이항분포의 형태를 조금 수정하여 사용할 것이다. 음이항분포의 수식을 변경하는 과정을 이해하기 위해서 이항분포와 음이항분포가 다루는 대상에 대해서 생..

개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다. ---------------------------------------------------------------------------------------------------- 이전 시간에 이어서 포아송분포의 평균을 구하는 것을 알아보자. 포아송분포의 기댓값의 정의를 보자. 가 된다. 이전 시간에 보았던 전개과정을 생각해보자. 일단 우리는 x를 지우는 방향으로 식을 전개해보자. 가 된다. 이제 이를 다시 포아송 분포로 꼴이 되도록 만들어 보자. 위의 수식에서 x-1=k 로 놓으면, 다시 포아송분포가 된다(왜 k=-1이 아니어도 되는지는 이전 시간에 다루었다). 모든 확률분포의 전체 합은 1이 되기 때문에..

개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다. ---------------------------------------------------------------------------------------------------- 이번 시간에는 적률생성함수의 1차 미분과 분포들의 평균과 동일하다는 것을 직접 계산을 통해서 확인해 볼 것이다. 가장 먼저 이항분포를 살펴보자. 이항분포에 대한 기댓값을 수식으로 표현하면, 가 된다. 이제 위에 수식을 편하게 정리하기 위해서 풀어서 살펴보자 여기서 사실 다음 단계로 넘어가는 과정이 개인적인 생각으로는 이해하기가 조금 어려웠다. 과정은 이해가 되는데, x를 지우고 다시 새로운 이항분포를 만들어 내는 과정을 생각해 내..

개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다. ---------------------------------------------------------------------------------------------------- 일단 적률을 수학적 표기로 표현하면, n차 적률을 아래와 같이 표현한다. (적률이 정의가 어디서부터 시작됐고, 왜 저런 정의를 내렸는지는 잘 모르겠다...... 개인적인 생각으로 적률이 가지는 의미는 어떤 분포에 대한 정보를 압축해서 가지고 있는 느낌으로 이해하고 있다. 어떤 확률분포를 표현하는 가장 기본적인 대푯값이 기댓값이고, support가 bounded하면 모든 n차의 적률이 같으면 같은 확률분포라고 하기 때문에 적률을 확..

개인적으로 이해한 내용을 정리한 부분이라서 틀린 내용이 포함될 수 있음을 양해해 주시기 바랍니다. ---------------------------------------------------------------------------------------------------- 지수분포는 포아송분포를 시간의 관점으로 본 확률이라고 생각하면 된다. 지수분포는 처음 사건사 일어날 때 까지의 시간이 얼마나 소요 되었는가를 확인하는 분포이다. 기존의 포아송 분포의 공식이 이다. 여기서 x=0을 대입하면, t에 따른 확률분포가 아래와 같이 나타난다.(람다는 알고 있다고 가정함) 가 된다. 여기서 우리는 t에 대한 확률을 알고 싶기 때문에, t에 대한 cdf를 다름과 같이 구할 수 있다.(여기서 우리가 모르는 값이..

개인적으로 이해한 내용을 정리한 부분이라서 틀린 부분이 있을 수 있음을 양해해주시기 바랍니다 ------------------------------------------------------------------------------------------------------------------ 이번 시간에는 다양한 확률 분포에 대해서 알아보자. 가장 기본적인 확률 분포는 베르누이분포이다. (개인적인 생각으로 확률 분포를 만들기 위해서는 확률 변수가 어떤 상황을 나타내는지가 매우 중요하다고 생각한다) 베르누이분포는 (성공/실패)의 두 가지 중에서 하나를 선택하기 위한 확률 분포이다. 따라서 성공의 확률을 p라고 하면 실패의 확률을 1-p가 되고 이를 수식으로 종합하면, 로 표현이 가능하다. (이전에도 ..

개인적으로 이해한 내용을 정리한 것이라서 틀린 부분이 있을 수 있음을 감안하고 봐주시면 감사하겠습니다 --------------------------------------------------------------------------------------------------------------------- 우리는 X에 대한 확률을 알고 있을 때, Y = g(X) 확률을 찾고 싶다고 하자. 이를 위한 2가지 방법이 있다. 첫 번째 방법이 cdf테크닉이다. 이 방법은 Y에 대한 cdf를 X에 대한 cdf로부터 유도하였다가 다시 Y로 미분하여 Y의 확률을 구하는 방법이다. 로 표현을 할 수 있다. 예를 들어보자 라면 Y의 확률은 다음 과정으로 구할 수 있다. 우선 X에 대한 cdf를 다음과 같이 구할 수..