이 글은 확률 개념의 시작에서 추상화까지의 개념 발전과정을 다룬다.
1. 확률 개념의 수학사
확률의 연구는 유럽 귀족들이 그들이 즐기던 도박의 진행상황을 예측해 보다 유리한 전략을 짜보려는 호기심에서 출발했다. 이 연구의 역사적 진행상황은 다음과 같이 간략히 표현할 수 있다.
콜모고로프가 확률을 공리적으로 정의할 때부터 확률론이 수학적으로 연구될 수 있는 준비가 끝났다고 보면 된다.
2. 수학적 확률; 라플라스의 정의
표본공간 $S$가 유한집합이고, 그 집합의 한 원소로 이루어진 부분집합, 즉 근원사건의 확률이 같은 정도로 기대될 때, 사건 $A \subset S$가 발생할 확률 $\mathrm P(A)$는 다음과 같이 정의된다.(단, $n(X)$는 집합 $X$의 원소의 개수를 말한다.) $$ \mathrm P(A) = \frac { n(A)}{n(S)}$$
3. 통계적 확률
라플라스가 정의한 확률은 현실을 반영하기에는 너무 이상적이었다. 많은 경우에 시행의 결과가 무한하다는 것을 제하고라도, 각 근원사건이 발생할 가능성이 거의 비슷하다는 것은 실제와는 맞지 않았다. 그렇게 해서 고안된 것이 통계적 확률이다.
동일한 시행을 $n$번 반복해서 사건 $A$에 해당하는 결과가 $r_n$번 나왔다고 할 때, 사건 $A$의 통계적 확률은 다음과 같이 정의된다. $$\lim_{n \to \infty} \frac {r_n} n$$
하지만, 이 극한이 수렴한다는 보장이 없다. 수학적 확률을 정의할 때처럼 각 근원사건일 발생할 가능성이 같을 때 수학적 확률과 통계적 확률이 일치한다는 사실은 큰수의 법칙에 의해 증명된다. 하지만, 다른 경우에는 어찌된다는 보장이 없다.
4. 공리적 확률
실생활과 부대끼며 발전하던 확률론이 어느 정도 성숙해지자, 수학자들은 확률만이 가지는 고유의 성질을 파악하기 시작했다. 그 결과로 콜모고로프는 확률을 추상화하는데 성공한다.
공리적 확률은 우선 우리가 사건이라고 부르던 것부터 다시 손을 본다. 사건을 정의하기 위해 도입한 수학적 구조가 시그마 대수($\sigma$-algebra)이다. 시그마 대수의 정의는 다음과 같다.
- $S \in \Sigma$
- $A \in \Sigma$일 때 $A^{\mathrm C} \in \Sigma$
- $A_i \in \Sigma$($i=1$, $2$, $3$, $\cdots$)일 때 $$ A_1 \cup A_2 \cup A_3 \cup \cdots \in \Sigma$$
잘 살펴보면 전사건(1번), 여사건(2번), 합사건(3번)이 사건이 되도록 보장된 구조를 시그마대수라 함을 확인할 수 있다. 세 번째에서 합집합의 계산을 특별히 가산개의 집합으로 제한한 것은 우리가 여러 사건을 조합해서 새로운 사건을 만드는 과정에서 (이상한 짓만 안하면) 발생할 수밖에 없는 제약을 추상화한 것이다. 공사건과 곱사건도 역시 시그마대수의 원소가 된다는 것은 위 정의에서 증명이 가능하다.
확률은 위에서 정의한 사건에 0이상 1이하의 실수를 다음과 같은 규칙에 따라 대응시킨 함수로 정의되어 있다.
- 모든 $A \in \Sigma$에 대해 $\mathrm P(A) \geq 0$
- $\mathrm P(S) =1$
- 임의의 $A_i$, $A_j$($i \neq j$)에 대해 $A_i \cap A_j = \varnothing$일 때 $$ \mathrm P(A_1 \cup A_2 \cup A_3 \cup \cdots ) = \sum_{i=1}^{\infty} \mathrm P(A_i)$$
집합의 원소의 개수, 어떤 영역의 넓이, 부피, 길이 등이 위 성질을 잘 만족하므로 많은 경우 우리는 직관적으로 허용된 값으로 확률을 구하게 되지만, 위 성질을 만족하는 다른 다양한 함수를 이용해서도 확률을 정의할 수 있다. 대표적인 것이 확률밀도함수를 통한 확률의 정의다.