HOME > 事業内容 > 最近の話題 > 平均値に関して広まった迷信?
文責 : 神山 敏
平成28年7月6日
大気への排出係数を施設ごとに算出し、それらの「平均値」を算出することになった。その目的は、「全国排出量を推計するための排出係数」を設定することである。
その際、関係者の間で「どのように平均値を算出すべきか」が議論となった。平均値といっても、算術平均とか加重平均とか幾何平均とか、いろいろな種類の平均があるではないか・・・という議論である。
このように、仕事では数値データを扱うことが多いが、私は仕事を通じて以下のような「噂」を何度か聞いたことがある。「噂」といっても、立派な専門家の発言である。
噂(ア) 桁数が大きく異なる数値の平均値を算出するときは、算術平均ではなく幾何平均を使うべきである。 噂(イ) 算術平均値は値の大きなデータに引っ張られてしまうという「欠点」がある。 |
実際問題として、環境の分野でもデータ処理で幾何平均が使われることは珍しいことではない。例えば、以下のような使用例がある。
①水質モニタリングデータの代表値として
②複数の排出係数をまとめて一つに集約するとき
上記①の例では、検出された濃度の「標準的な値を示す」という目的で幾何平均が使われており、他の代表値(例:中央値)も並記されているため、代表値の例として示しているのに過ぎないと考えられる。また、上記②の例では、「我が国全体の排出量を推計する」という目的で排出係数を一つに集約しており(その集約の手段として幾何平均が使われており)、この後者の例のほうが使用目的が明確である。
これら①と②の例で幾何平均が使われた理由は資料中に明記されていないが、その背景には前記の噂が関係している可能性が高い。
※「噂」と表現するのは聞こえが悪いかもしれないが、必ずしもその主張を否定するつもりはなく、ここでは注意喚起と問題提起にとどめたいと考えている。