環境情報解析、政策立案、環境システム開発の【RIES】株式会社 環境計画研究所
株式会社 環境計画研究所
お電話でのお問い合せ
事業紹介

HOME  >  事業内容  >  最近の話題  >  平均値に関して広まった迷信? 1  >  2

平均値に関して広まった迷信?2/3

(3) 私の問題提起

 これらの主張(噂)はもっともらしく聞こえるが、冷静に考えてみると、その奇妙さに気がつく。前記の噂(ア)の「桁数が大きく異なる数値」の定義が曖昧であることは許容するとして、何らかの方法でそれが定義できたと仮定しよう。複数の数値データから成るデータセットは無数に存在しており、各数値は連続的に変化する値を取り得るので、それらのデータセットの平均値も連続的な値を取り得ることになる(数学的な証明を待つことなく、これは自明だろう)。但し、これは同じ方法で平均値が算出されるときは・・・という条件付きであることが問題である。

 「桁数が大きく異なる数値」から成るデータセットがあったとして、その数値を連続的に変化させていけば、やがて「桁数が大きく異ならない数値」だけから成るデータセットができるはずである。前記の噂(ア)に従うならば、前者の平均値としては幾何平均が使われる(べきである)が、後者の平均には算術平均が「適切な平均値」として使われる可能性がある。そのとき、データセットの数値は連続的に変化したにも関わらず、「適切な平均値」が不連続に変化してしまうことになる。こんなことが科学的に正しいとは思えない。

 また、噂(イ)については、幾何平均との比較において「値の大きなデータの影響が強く反映される」という事実にとどめれば正しいことだが、「引っ張られてしまう」とか「欠点」といった価値判断を付加する(又は情緒的に表現する)ことは、科学的な表現とは思えない。そのような主張の背景には、「平均値とはこのような値であるべきだ」という価値判断(又は思想)が潜んでいるのだと思われるが、それを具体的に根拠と共に示さなければ、宗教論争のような不毛の議論になりかねない。

  •  

(4) 問題の本質

 このような混乱が生じてしまうのは、その「平均値」という値をどのように(又は何の目的に)使うのか、平均値を算出するための前提条件が明確になっていないからだろう。前記?@の例(水質モニタリングデータの代表値)であれば、「標準的な値を示す」という漠然とした目的で幾何平均値を示しているのに過ぎない(と考えられる)ため、何の異論もない。しかし、前記?Aの例(複数の排出係数をまとめて一つに集約)であれば、「我が国全体の排出量を推計する」という具体的な目的が存在しており、やや状況が異なっている。前記?Aの例であれば、なぜ幾何平均値を使うのか、その判断理由を明確にすべきである。

 このように、平均値を算出するときは、その平均値の使用目的を明らかにすることが不可欠で、その前提条件なしに「どのような平均値が適切か」を論じること自体が無意味なことである。このような平均値算出の基本的な考え方について、自分なりに整理してみた(下記)。

  •  
123
  •