異常値
/いじょうち
アンケートなどで得られたデータが現実の状況を反映していない(事実と異なるデータとして回答された)と考えられる値のこと。データを活用する際には修正されるべきものであるが、事実確認が困難で修正できないときは、一般には集計対象から除外するなどの対応が必要とされている。
FDTD法
/えふでぃーてぃーでぃーほう
Finite-Difference Time-Domain method(有限差分時間領域法)の略であり、時間と空間を変数とする微分方程式を差分方程式で近似して解く数値計算法のこと。具体的には、各格子点で空間方向の差分計算を行った後、時間方向の差分を計算し、その結果を基に再び空間方法の差分計算をする・・・という計算を繰り返し行う方法で、例えば電磁場の解析や弾性体振動の解析、騒音の伝播計算等で活用されている。FDTD法を使えば複雑な地形でも数値計算が可能であるが、時間及び空間の解像度を高めると膨大な計算量が必要となるおそれもある。
解像度
/かいぞうど
データ等が得られる時間や空間の間隔のことで、時間分解能や空間分解能ともいう。 多くの物理現象は時間的空間的に変動しているため、対象とする物理現象の時間スケール及び空間スケールにあったデータを解析する必要がある。例えば、特定の地点で潮汐による水位変動を解析する場合は、干潮と満潮が1日2回ずつあることから、その水位変動の実態を適切に把握するには、少なくとも12時間÷4=3時間の時間分解能のデータが必要である。また、例えば、集中豪雨の空間スケールは通常10km程度であるから、集中豪雨による降雨量を把握するためには10km以下の空間分解能のデータが必要となる。
加重平均
/かじゅうへいきん
複数のデータから算出する「平均」の一種で、個々のデータの"重要性"を考慮して算出される平均のこと。 例えば、職業別の平均所得から全職業の平均所得を算出する場合、職業別に就労人口が異なるため、職業別の平均所得にその就労人口で重み付けを行って算出する加重平均値を使うのが一般的である。
GISシステム
/じーあいえすしすてむ
⇒「地理情報システムへ」を参照
重回帰分析
/じゅうかいきぶんせき
多変量解析の一つであり、2つ以上の説明変数を使って目的変数の値を説明する解析方法。説明変数が1つの場合は単回帰分析という。
解析においては、最小二乗法等により求めた重回帰式が統計的に意味を持つかどうか、各説明変数から目的変数を説明できるかどうか等を検定する必要がある。
信頼区間
/しんらいくかん
無作為に抽出したサンプルから母集団の特性を推定する場合、本来の母集団の特性から誤差が生じるため、推定値に一定の幅を持たせる方法を区間推定といい、その幅の広さを信頼区間という。また、信頼区間の幅を決める基準を信頼度といい、統計上95%もしくは99%信頼度が用いられることが多い。例えば母集団の平均年齢を無作為抽出した人たちの年齢から推定する際に「平均年齢の信頼区間は、信頼度95%で34〜42歳である」といった場合、100回の調査のうち95回はこの幅の中に母平均が含まれるという意味。
属性
/ぞくせい
有害大気モニタリングに関する地点選定ガイドラインにて定義した用語。
有害大気汚染物質モニタリング調査結果では、従来、一般環境や固定発生源周辺といった地域分類が測定地点ごとに定められていたが、同ガイドラインではこれらを地点別・物質別に設定するという新たな考えを取り入れたため、従来の「地域分類」ではなく「属性」という用語を使用した。
その結果、ある測定地点の属性が「ベンゼンにとっては固定発生源周辺で、トリクロロエチレンにとっては一般環境」などと物質ごとに区別されることとなった。
大気拡散モデル
/たいきかくさんもでる
大気汚染を予測するためのモデルのうち、大気の状態が定常であることを仮定し構築されたモデル。流体力学的には、移流拡散方程式の定常状態 (∂φ(t,x)/∂t=0、 φは特定の物理量) を仮定した場合の解析解である。
ある地点での大気の状態(風速、気圧、気温)は、周辺地の大気の状態に応じて時間的に変化するが (例えば高気圧側から低気圧側に風が吹くなど) 、大気拡散モデルでは、その時間的変化がないと仮定する。
環境分野においては、特定の発生源(工場、車など)から大気汚染物質が定常的に排出されると仮定したモデルがあり、プルーム・パフモデルとよばれている。
大気拡散モデルは、短期的又は複雑な地形での予測、大気中の水の相変化や化学反応を伴う大気汚染物質の濃度予測には不向きであり、その場合は定常状態を仮定せずに流体力学の移流拡散方程式をコンピュータにより直接的に解く3次元流体モデルを用いることもある。
代表性
/だいひょうせい
「データの代表性」といった形で使われ、測定等によって得られたデータが母集団の全体を代表するのにふさわしいと考えられる程度のこと。 例えば、 自動車の交通量をカウントするとき、大型連休の期間に得られたデータは 「平常時の交通量」とは大きく異なると考えられるため、1年間の交通量を推定するためのデータとして使うのは不適当で、「データの代表性が低い」などと表現される。
ダブルカウント
/だぶるかうんと
複数の条件に該当するものがあるとき、各条件に合致する数量を別々に算出し、それらを単純に合計することによって正味の数量を超えた数量になってしまうこと。一般に、データの集計方法として不適当な方法であり、それらの重複を排除した正味の数量として集計することが必要とされている。
地域メッシュ統計
/ちいきめっしゅとうけい
緯度と経度に沿った直線で地理的な範囲を網の目(メッシュ)に区切ったものを地域メッシュと呼び、その地域メッシュごとの数量として整備された統計データを地域メッシュ統計という。過去の国勢調査や事業所・企業統計調査のデータなどが地域メッシュ統計として整備されているが、3次メッシュの場合、全国にあるメッシュ数は38万あまり(値がゼロのメッシュも含む)と膨大であり、目的に応じて必要なデータを購入して使うのが一般的である。
中央値
/ちゅうおうち
複数の数値を大小関係で並べた際に最も中央に位置する数値のこと。母集団が偶数個の場合は最も中央に近い二つの数値を算術平均した値である。 例えば、"5", "50", "500", "5,000", "50,000" という 5個の数値があるとき、平均値は"11,111"であるが、中央値は "500" である。
平均値と類似した概念で用いられるが、平均値は母集団の中にある極端に大きい数値の影響を受けやすい。このため、母集団の代表的な数値を示すためには平均値より中央値が適している場合がある。
地理情報システム (GIS)
/ちりじょうほうしすてむ (じーあいえす)
さまざまな情報を地理的な場所と関連づけ、それを地図上に表記して集計や抽出などを可能にしたシステムのこと。環境の分野においては、例えば工場毎の排出量データを工場の立地場所と関連づけ、地図上に排出量を図形等で表すことが考えられる。
同じ地図上に複数のデータを重ね合わせることが可能であるため、例えば工場毎の排出量データと汚染物質のモニタリングデータをGISに取り込み、両者の地理的な分布から関係性を明らかにすることが考えられる。
ばらつき
/ばらつき
アンケートや測定などでデータが得られたとき、アンケートの回答者や採取した試料等によって異なった値になるのが一般的であるが、その不規則に値が乱れる程度のこと。一般に、ばらつきの大きなデータに基づいて平均値を算出した場合、その平均値の信頼性が低くなる傾向がある。 したがって、このばらつきの程度を定量的に示す方法として、算出された値の信頼区間を示す方法が使われることがある。
不確実性
/ふかくじつせい
真の値と観測データや推定値との差を「誤差」と呼ぶのに対し、真の値が不明な場合に、その真の値が存在する範囲の広さを確率的に表す指標のこと。
例えば、得られたデータにばらつきがあるとき、それらのデータに基づいて推計された排出量も一定のばらつきがある。その排出量の真の値が含まれる範囲を95%信頼区間として表すとき、その中央値と信頼区間の幅との比率によって不確実性を表すことができる。
不確実性評価
/ふかくじつせいひょうか
数学的な手法を用いて不確実性の程度を定量的に評価すること。
化学物質の排出量推計に関連した不確実性評価であれば、推計に使う個々のパラメータ(例:排出係数)ごとに不確実性を評価し、それらを使って算出される排出量も不確実性が評価される。不確実性評価の結果は、算出された排出量等の値とその95%信頼区間の幅との比率などとして示される。
測定データに基づき平均値を算出する場合、一般に得られたデータ数が多く、そのばらつきの程度が小さいほど平均値の不確実性が小さくなる。
平均値
/へいきんち
複数のデータが得られた場合、それらのデータが属するグループの「代表的な値」として算出される値のこと。その「平均」としては、単純平均(算術平均)や幾何平均、加重平均などが定義され、目的に応じて使い分けられている(「ばらつきの程度」に応じて使い分けるのは正しくなく、その平均値をどう使うかという「目的」に応じて使い分けるのが正しい)。
母集団
/ぼしゅうだん
統計学では「情報を把握すべき対象の全体」という意味であり、そこから抽出された一部を「標本」と呼ぶのに対比して使われる。その統計学における「母集団」と「標本」との関係に類似するものとして(統計学のアナロジーとして)、選定すべき化学物質等の候補となるものの全体像を「母集団」と呼ぶことがある。
化学物質は非常に多岐にわたっており、数も多いため、特定の物質を抽出する際には、目的に応じて検討対象とする化学物質のグループをあらかじめ選定しておき、それらをまとめて母集団とすることがある。
MOVES
/むーぶす
米国環境保護庁(EPA)によって開発された自動車排ガス専用のシミュレーションモデルのこと。MOVESとは"Motor Vehicle Emission Simulator"の略である(MOVES2014a_2015年10月リリース)。車両走行時の排出に加え、ランニングロス(RL)、ホットソークロス(HSL)等の燃料蒸発ガスの排出量を予測できる。
メッシュ
/めっしゅ
緯度と経度に沿った直線で地理的な範囲を網の目(メッシュ)に区切ったものを地域メッシュと呼び、大きさに応じて1次メッシュ(緯度40分(1度の2/3)、経度1度ごとの区画)、2次メッシュ(1次メッシュを東西・南北に各8等分)、3次メッシュ(2次メッシュを東西・南北に各10等分)等と呼ばれる。そのうち3次メッシュは東西・南北方向が共に1km程度であり(東西方向の距離は緯度によっても異なる)、地域メッシュによって地理的な分布を表すとき最も頻繁に使われるため基準地域メッシュとも呼ばれ、8桁のメッシュコード(例:52364726)が付与されている。
モンテカルロシミュレーション
/もんてかるろしみゅれーしょん
乱数を利用した数値計算手法の総称であり、一般に「確率論的問題」と「決定論的問題」で適用される。前者では求める値の計算式に確率変数の関数が含まれる場合に、その確率分布を基に乱数を発生させて多数回計算を行い、求める値の分布を算出する。後者では高次元、多変量の積分など式が複雑で計算量が多くなる場合に、確率モデルに置き換えた後、乱数を発生させて近似解を求める。