확률과 통계
1. 확률의 역사적 배경
100만년전 인류가 탄생한 이래로 자연의 우연과 필연사이를 인간이 계속적으로 접하며 살아 왔으나 궁극적인 우연과 불확실에 대한 학문적인 접근은 이루어지지 않았었다. 최근 500 여년 전인 16세기에 이르러서야 구체적으로 확률계산에 대한 생각을 하게 되었다. 이 우연의 게임은 1494년의 파촐리(Pacioli, 1450-1520)가 지은 "summa de arithmetica" 라는 책에서 게임이 중단되었을 경우의 상금의 분배문제를 언급하고 있다.
또한, 우연의 사실을 법칙으로 수학화하려고 노력한 여러 사람들 중에 파스칼(Pascal, 1623-1662)은 친구의 부탁으로 주사위 문제와 분배의 문제를 1654년에 고려하고 숙고하였으며, 이 문제를 페르마(Fermat, 1601-1655)에게 전하고 이들 두 사람은 이 문제를 명쾌하게 해결하였다. 이 사건이 확률이 수학적 이론으로서 세워지는 것을 제기하게 된 결정적 계기로 보고 있다. 이들 두 사람의 연구는 당시에 확률에 대한 지대한 관심을 촉발했고, 이로 인해 확률론의 초기의 문제는 주로 우연의 게임의 결과에 모아졌으며, 확률에 대한 불충분한 정의로부터 야기되는 여러 가지 문제점이 있었으나 1700년을 지나면서 발전하기 시작했다.
1655년에 호이겐스(Huygens, 1629-1695)는 파스칼의 아이디어를 이용하여 확률에 관한 독자적인 논문을 처음 작성하게 된다. 그 후 베르누이(Bernoulii,1667-1748)에 의해 확률론 만을 다룬 저서가 만들어지고 드므와브르(DeMoivre, 1667-1754)와 오일러(Euler, 1707-1783), 라플라스(Laplace, 1749-1827), 가우스(Gauss, 1777-1855)등의 노력으로 확률론은 급속히 발전해 나갔다. 그러나 아직까지도 확률의 정의가 역시 불충분한 관계로 20세기에 들어와 수학자들의 연합된 노력의 결과로 1930년대에 출판된 콜모고로프(Kolmogorov)의 확률론의 기초라는 책에서 엄밀한 공리론적 토대위의 공리적 확률을 정의하기에 이른다.
2. 확률의 정의
"확률이란 무엇인가" 라고 질문을 받는다면 우리는 무엇이라고 말하겠는가 ? 이러한 쉽지 않은 질문의 대답으로서 다음과 같은 각각의 확률의 의미를 알아보자.
1) 고전적 확률(수학적 확률)
같은 조건하에서 여러번 반복할 수 있는 어떤 시행에서 일어날 가능성이 있는 모든 결과를 원소로 하는 집합 S를 그 시행의 표본공간(sample space)이라고 한다. 이 때 어떤 사건이 일어날 가능성이 같은 정도로 기대되어(equally likely)질 때 이를 수치적 척도로서 고정하여 가정하는 것으로 라플라스(Laplace)는 다음과 같이 확률을 정의하였다.
N개의 근원사건으로 구성된 표본공간에서 각각의 근원사건이 일어날 가능성이 같은 정도일 때, m개의 근원사건으로 구성된 사건 A가 일어날 확률 P(A)는 P(A) = m/N 이다. 그러나 이 정의는 근원사건이 유한개인 경우만 적용가능하며 실제로 일어나는 문제에 이 개념을 도입하기가 어렵다.
2) 통계적 확률(경험적 확률)
오랜 시간을 두고 여러 번 통계적 시행을 반복하면 한 사건 A의 상대도수는 어떤 값에 가까워 질 것이다. 즉, 오랜 관찰 끝에는 일정한 패턴을 찾아 낼 수 있는 것처럼 상대도수의 극한으로 확률을 정의할 수 있다.