【Excel】基本的な統計関数
統計と聞くと、専門的なデータ活用や分析をイメージする方もいるかもしれませんが、案外、日常生活の中で何かと目にしていたり耳にしていたりします。
そこで、今回はExcel関数を使った実務や実生活に活かせる統計をご紹介いたします。
次のような簡易的なデータベースを使用してご説明します。

Excelでは、【AVERAGE関数】、【AVERAGEIF関数】、【AVERAGEIFS関数】などで求めます。

今回は条件を絞らず平均値を求めましたが、『男性』の平均年齢や、『東京都出身の女性の平均年齢』など、
条件を指定した平均値も【AVERAGEIF関数】、【AVERAGEIFS関数】を使って求めることができます。
これは年収の低い順または高い順に並べたときに真ん中にくる値です。
Excelでは、【MEDIAN(メジアン)関数】で求めます。
引数(括弧の中)には数値を指定し、数値の個数が偶数である場合には、中央に位置する2つの数値の平均の値が返されます。

今回は年齢の中央値のため、最年少もしくは最年長から順番に並べると『49歳』が真ん中になることがわかります。
たとえば、複数の点数のリスト(例: 70点、80点、60点、80点、90点)がある場合、最も回数が多い「80点」が最頻値となります。
Excelでは、【MODE.SNGL(モード・シングル)関数】、【MODE.MULT(モード・マルチ)関数】で求めます。

『年齢』列にて最も多いのは『57』歳ということがわかります。
その結果を、棒グラフで表現したり、累積度数を折れ線グラフにしたりして利用します。
Excelでは、【FREQUENCY(フリークエンシー)関数】で求めます。引数には(データ配列,区間配列)を指定します。

※ スピル機能(動的配列機能)が働くため、絶対参照は設定していません。
※ 区間のF3~F10にはユーザー定義「0"年代"」を設定しています。
Excelでは、【STDEV.P(スタンダード・ディビエーション・ピー)関数】などで求めます。

平均年齢から『18.7』のばらつきがあるということが解かります。
・標準偏差が 小さい → データが平均の近くに集まっている(安定している)
・標準偏差が 大きい → データが平均から離れている(ばらつきが大きい)
ということですので、今回はかなりばらつきがあることを示しています。
ちなみに、テストや模試などで使用される「偏差値」は、「=50 + [{ (対象の点数 - 平均点) ÷標準偏差}×10]」で求めます。
Excel関数を使えば、素早くそして確実に確率や統計の計算が行えますので、身近なデータ活用や分析にぜひお役立てください。
そこで、今回はExcel関数を使った実務や実生活に活かせる統計をご紹介いたします。
次のような簡易的なデータベースを使用してご説明します。

(1) 平均値
統計の中で最も馴染みのある数値が平均だと思います。平均気温や平均身長、平均年齢など幅広い分野で使用されています。Excelでは、【AVERAGE関数】、【AVERAGEIF関数】、【AVERAGEIFS関数】などで求めます。

今回は条件を絞らず平均値を求めましたが、『男性』の平均年齢や、『東京都出身の女性の平均年齢』など、
条件を指定した平均値も【AVERAGEIF関数】、【AVERAGEIFS関数】を使って求めることができます。
(2) 中央値
中央値とは、データを小さい順に並べたときに真ん中にくる値を指します。ニュース等で「所得の中央値」という表現を聞いたことがあると思います。これは年収の低い順または高い順に並べたときに真ん中にくる値です。
Excelでは、【MEDIAN(メジアン)関数】で求めます。
引数(括弧の中)には数値を指定し、数値の個数が偶数である場合には、中央に位置する2つの数値の平均の値が返されます。

今回は年齢の中央値のため、最年少もしくは最年長から順番に並べると『49歳』が真ん中になることがわかります。
(3) 最頻値
最頻値とは、データの中で最も多く出現している(=頻度が高い)値を指します。たとえば、複数の点数のリスト(例: 70点、80点、60点、80点、90点)がある場合、最も回数が多い「80点」が最頻値となります。
Excelでは、【MODE.SNGL(モード・シングル)関数】、【MODE.MULT(モード・マルチ)関数】で求めます。

『年齢』列にて最も多いのは『57』歳ということがわかります。
(4) 度数分布
度数分布とは、データを一定の範囲(階級)に分け、各範囲にどのくらいのデータがあるか(=度数)をまとめたものです。その結果を、棒グラフで表現したり、累積度数を折れ線グラフにしたりして利用します。
Excelでは、【FREQUENCY(フリークエンシー)関数】で求めます。引数には(データ配列,区間配列)を指定します。

※ スピル機能(動的配列機能)が働くため、絶対参照は設定していません。
※ 区間のF3~F10にはユーザー定義「0"年代"」を設定しています。
(5) 標準偏差
標準偏差とは、データのばらつきや散らばり具合を示す統計学的な指標です。平均値から各データがどの程度離れているかを、元のデータの単位で表したもので、数値が大きいほどばらつきが大きいことを意味します。Excelでは、【STDEV.P(スタンダード・ディビエーション・ピー)関数】などで求めます。

平均年齢から『18.7』のばらつきがあるということが解かります。
・標準偏差が 小さい → データが平均の近くに集まっている(安定している)
・標準偏差が 大きい → データが平均から離れている(ばらつきが大きい)
ということですので、今回はかなりばらつきがあることを示しています。
ちなみに、テストや模試などで使用される「偏差値」は、「=50 + [{ (対象の点数 - 平均点) ÷標準偏差}×10]」で求めます。
Excel関数を使えば、素早くそして確実に確率や統計の計算が行えますので、身近なデータ活用や分析にぜひお役立てください。








