이 글에서는 수학을 공부하면서 만나게 되는 산술, 기하, 조화평균 등과 같이 유한한 자료에 대해 정의되는 평균을 하나의 법칙에 의해 일반화 하는 대표적인 방법에 대해 다룬다. 이야기의 전개를 편하게 하기 위해 양의 실수값에 대해서만 설명할 것인데, 많은 경우 0 이하의 실수로 일반화가 가능하다.
두 양수 $a$, $b$($a \leq b$)의 평균은 다음과 같은 성질을 갖는 함수 $M(a,b)$로 정의하는 사람도 있다.
- $a \leq b$이면 $a \leq M(a,b) \leq b$
- $M(a,b) = M(b,a)$
- $M(a,b) = a$이면 $a=b$
위 조건 중 1번에서 $a=b$이면 $M(a,b) = a = b$라는 사실을 유도할 수 있다. 2번의 성질은 충분히 일반적이지 않다. 일반적으로 사용되는 평균 중 가중치가 있는 $M(a,b) = \frac 1 4 a + \frac 3 4 b$와 같은 꼴은 이 성질을 만족하지 않는다. 마지막 조건은 1번의 역 방향의 서술인데, 꼭 필요한지는 모르겠다. 이 정의의 출처는 다음과 같다.
Philips, G. M., Two Millennia of Mathematics: from Archimedes to Gauss, Springer-Verlag, New York, 2000.
평균값을 나타내는 식을 함수의 성질을 통해 다룬다면 위 정의는 바람직하지 않아 보인다.
현재까지 여러 형태의 평균을 하나의 방법으로 다루려는 시도는 수식 자체에 집중해 이루어졌다.
Generalized Mean / Minkowski Mean
일반화된 평균 또는 민코프스키 평균[1] 은 다음과 같은 식으로 정의된다. $$M_p (a_1 , a_2 , \cdots, a_n) = \begin{cases} \displaystyle{\left( \frac 1 n \sum_{i=1}^n (a_i)^p \right)^{\frac 1 p}} & (p \neq 0) \\ \displaystyle{\sqrt[n]{ \prod_{i=1}^n a_i}} & (p = 0) \end{cases}$$ 가중치를 반영했을 때는 다음과 같이 정의한다.($\sum w_i =1$) $$M_p (a_1 , a_2 , \cdots, a_n) = \begin{cases} \displaystyle{\left( \sum_{i=1}^n w_i(a_i)^p \right)^{\frac 1 p}} & (p \neq 0) \\ \displaystyle{ \prod_{i=1}^n (a_i)^{w_i}} & (p = 0) \end{cases}$$ $p=0$일 때 식이 뜬금없이 달라 보이지만, $p \to 0$일 때 $M_p \to M_0$임을 보일 수가 있다.[2]
이 정의가 일반화된 정의인 이유는 가중치가 없는 경우 다음과 같이 $p$값에 따라 기존에 알려진 산술, 기하, 조화평균들이 모두 얻어지기 때문이다.
- $M_{-\infty} (a_1, a_2 , \cdots , a_n)= \min \{ a_1, a_2 , \cdots , a_n \}$[3]
- $M_{-1} (a_1, a_2 , \cdots , a_n) = \dfrac{n}{ \frac 1 {a_1} + \frac 1 {a_2} + \cdots + \frac 1 {a_n} }$ (조화평균)
- $M_0 (a_1, a_2 , \cdots , a_n)= \sqrt[n] {a_1 a_2 \cdots a_n} $ (기하평균)
- $M_1 (a_1, a_2 , \cdots , a_n) = \dfrac{a_1 + a_2 + \cdots +a_n}{n}$ (산술평균)
- $M_{\infty}(a_1, a_2 , \cdots , a_n) = \max \{ a_1, a_2 , \cdots , a_n\}$[4]
$p < q$일 때 $M_p \leq M_q$라는 사실도 편미분을 통해 유도할 수 있다.
[1] 민코프스키 평균은 민코프스키 거리와 수식 형태가 비슷하게 보여서 몇몇 수학자가 부르는 이름이다.
[2], [3], [4] 위키피디아의 이곳에서 증명을 확인할 수 있다.
Lehmer Mean
Lehmer mean $L_p (a_1 , a_2 , \cdots , a_n )$은 다음과 같은 식으로 정의된다. $$ L_p (a_1 ,a_2 , \cdots , a_n ) = \frac{ a_1^p + a_2 ^p + \cdots + a_n^p} {a_1^{p-1} + a_2 ^{p-1} + \cdots + a_n^{p-1}}$$ 이 식도 앞서 살펴본 평균과 비슷한 성질을 가진다. 간단히 확인 가능한 것들만 나열한다.
- $L_{-\infty} (a_1 , a_2 , \cdots , a_n ) = \min \{ a_1 , a_2 , \cdots , a_n \}$
- $L_0$는 조화평균
- $L_{1/2} (a_1 , a_ 2) = \sqrt{a_1 a_2 }$ (두 수의 기하평균)
- $L_1$은 산술평균
- $L_\infty$는 최댓값
Quasi-Arithmetic Mean / Generalized $f$-Mean / Kolmogorov Mean
준-산술평균 또는 일반화된 $f$-평균 또는 콜모고로프 평균은 특별한 함수 $f$를 이용해서 평균을 정의하는 방법으로 통계학에서 많이 사용된다.
$a_1$, $a_2$, $\cdots$, $a_n$을 포함하는 구간 $I$에서 정의된 일대일 연속함수 $f:I \to \mathbb R$에 대해 콜모고로프 평균 $K_f$는 다음과 같은 식으로 정의된다. $$K_f (a_1 , a_2 , \cdots a_n ) = f^{-1} \left( \frac { f(a_1) +f(a_2) + \cdots + f(a_n)} n \right)$$ 이 정의식은 다음과 같은 특별한 경우에 우리가 알던 평균으로 변형된다.
- $f$가 일차함수인 경우에 $K_f$는 산술평균이 된다.
- $f(x)= \log(x)$인 경우 $K_f$는 기하평균이 된다.
- $f(x) = 1/x$인 경우 $K_f$는 조화평균이 된다.
- $f(x)=x^p$일 때 $K_f = M_p$, 즉, 민코프스키 평균이 된다.($p \neq 0$)