ぱと隊長日誌

ブログ運用もエンジニアとしての生き方も模索中

二乗平均の分母はなぜ平方根に含めるのか?

はじめに

二乗平均の計算は各データを2乗して足してデータの個数で割り、そのあと平方根をとります。
\displaystyle\sqrt{\frac{a_{1}^2+a_{2}^2+\cdots+a_{n}^2}{n}}

各データを2乗して足すのはマイナスの符号をなくすためで、このままでは単位が2乗になるために平方根をとる、と多くの資料で説明されます。

ですが、単位の問題だけであれば、各データを2乗した分子だけ平方根をとればよい気がするのは私だけでしょうか…?
そこで、分母も含めて平方根をとる理由について考察してみました。

今回、裏付け(もしくは否定)となる資料を探したのですが、見つけることができませんでした。もし関連する情報をご存知の方がいましたら、ぜひご連絡ください。

平均の計算式

算術平均はデータを全て足してデータの数で割る、いわゆる「平均」のことです。
\displaystyle\frac{a_{1}+a_{2}+\cdots+a_{n}}{n}

二乗平均とは2乗した値の平均をとる、というのが根底にあります。ですから、まずはこの値を計算します。これは算術平均と同じ形であることが分かります。
\displaystyle\frac{a_{1}^2+a_{2}^2+\cdots+a_{n}^2}{n}
単位の計算はこの値に対して行います。この結果として、分母を含めて平方根をとることになります。
\displaystyle\sqrt{\frac{a_{1}^2+a_{2}^2+\cdots+a_{n}^2}{n}}
これが分母を含めて平方根をとる理由となります。

平均の単位

単位の計算を次のように習った方もいるかもしれません。
時速は距離[km]を時間(hour)[h]で割る。だから[km/h]と記載する。

だとすれば、平均の単位とはどうなるのでしょうか?
距離の平均は距離[km]をデータの個数[個]で割るのだから、km/個とすべきでしょうか…?もしそうだとすれば、距離の2乗[km2]をデータの個数[個]で割ったとき、単位を[km2/個]とすべきなのでしょうか?
この単位の分子は[km2]ですから元の単位の[km]に戻すために平方根をとるのは理解できますが、単位の分母の[個]は2乗していないのに平方根をとってもよいのでしょうか?

そこで、まずは算術平均の単位を考えてみます。距離[km]の平均値の単位は[km]です。データの個数の単位[個]はどこにいったのでしょうか?
まず、距離というのは[km]という単位を持つ量です。これに対し、データの個数というのは単位を持ちません。単位を持たないため、[1]で表現することにします。すると、距離[km]の平均は 距離[km]/データ個数[1] = [km/1] = [km] となり、平均値の単位は[km]と言えることが分かります。

「データの個数」について補足すると、これは物理的な数ではありません。物理的な数ではないので単位をつけません。
例えば、3個のリンゴの平均の重さを計算する時、「3個のリンゴの重さの合計[g]/3」と計算します。この時、分母の3が「リンゴの個数」と考えると[個]という単位をつけたくなりますが、すると単位は[g/個]となり、1個当たりの重さの単位になってしまいます。
ここで求めたいのは平均の重さですので、単位は[g]であるべきであり、そう考えると分母は「データの個数」で単位がない(もしくは[1])とすることで距離の平均の場合との整合性をとることができます。

次に二乗平均の単位について考えます。
距離の二乗をデータの個数で割った値の単位は (距離[km])2/データ個数[1] = km2/1 = km2 となります。であれば、この値に平方根を取ることで[km]になることが分かります。

もし、二乗平均をとるデータの値に単位がなくても、その単位を[1]と考えれば、2乗した時の単位が[12]であり、それに平方根をとることで[1]となります。平方根をとらなくても[1]ではありますが、二乗平均をとる値の単位の有無に応じて公式が変わるのを避けるため、常に平方根をとっています。

まとめ

二乗平均は2乗した値の平均を計算し、データと単位を合わせるために平方根をとります。計算式は次の通りです。
\displaystyle\sqrt{\frac{a_{1}^2+a_{2}^2+\cdots+a_{n}^2}{n}}

分母も含めて平方根をとるのは、二乗平均は平均の計算が主軸にあり、まずはその計算を行ってから単位の計算を行うからです。

「二乗平均」は「二乗平均平方根」とも呼ばれます。「二乗した値の平均値の平方根をとる」という計算方法を考えると、「二乗平均平方根」という呼び方のほうがしっくりくるかもしれません。

参考

完全独習 統計学入門

完全独習 統計学入門

完全独習 統計学入門

今回の疑問を抱くきっかけになった一冊です。統計学を学び始めたい方の最初の一冊としてお勧めします。平均とは何かというレベルから解説しています。
中学数学(それも簡単な範囲)のみを利用して解説しています。それゆえに逆に難しい解説になってしまっている箇所もありますが、全体を通してみれば学びやすいと感じました。

Wikipediaの「無次元量」の解説

無次元量 - Wikipedia

「データの個数に単位はない」という発想はここから得ています。ただ、ぴったりに当てはまる項目がなく、私が考え違いをしている可能性もあります。
ご存知の方がいらっしゃいましたら、ぜひご教示ください。