使用関数:DVAR
分散については以下の記事で詳しく解説しています
DVAR関数とは?
DVAR(ディー・バリアンス)関数はデータベースで条件を指定して不偏分散を求めるエクセルの関数です。不偏分散とはデータの標本を無作為に抽出して求める分散値で、その結果から母集団の分散値を推測します。
DVAR関数は
- 作成した条件表を満たすレコード(行)をデータベースから検索します
- 検索したレコード内のデータの中で、指定したフィールド(列)にある数値データから不偏分散を求めます
DVAR関数の冒頭のDはデータベース(Database)の頭文字で、VARは分散を意味するバリアンス(Variance)の略です。Excel(エクセル)の関数で名前の冒頭に「D」が付くものは「データベース関数」に属し、データベースで使用することを前提とした機能を持っています。
データベースとはExcelの原則(データを項目別に列見出しで分類し、1行1データにまとめる)に沿って作成されているデータ表のことです。
データベースについて、データベースの作り方などを初心者にも分かりやすく解説しています。
DVAR関数で不偏分散を計算する
実力テストの成績表で女性だけの英語の点数でDVAR関数による不偏分散を求めてみたいと思います。
データベース関数は「関数ライブラリ」に載っていないので、引数のダイアログを開く時は「関数の挿入」ボタンをクリックします。
「関数の挿入」が開いたら「関数の分類」ボックスの▼を押して下へスクロールし、「データベース」をクリックします。
「関数名」の一覧が「データベース」配下のものに切り替わるので、「DVAR」を選択し、「OK」。
DVAR関数の引数ダイアログが開きます。
DVAR関数の書式
データベース関数の引数は一律に「データベース」「フィールド」「条件」の3つです。
書式の構成はこうなります。
第一引数「データベース」
この引数には列見出しも含めて表を指定します。
第二引数「フィールド」
「フィールド」は表の列見出しのことです。集計するデータ範囲ではなく、集計する列の見出しのセルをクリックで指定するか、または列の番号(左から何番目にあるか)を指定します。
ここでは「英語」をクリックで指定。列の番号「4」を入力してもOKです。
第三引数「条件」
「条件」は値の検索条件です。これは別に「条件表」を作って指定します。
ここでは列見出しの一つ「性別」の「女」をキーにして条件を指定します。必ず、条件表にも列見出しと同じ項目名を付けておき、項目名と条件を全て選択して指定します。
DVAR関数で「英語」列の「女」に合致する数値データから不偏分散が求められました。
DVAR関数に複数条件を指定する方法
DVAR関数の「条件」に複数の条件を指定することもできます。
例えば、AND条件で「数学が70点以上の男性の国語の不偏分散」を求めるなら、「数学:>=70」「性別:男」を横並べにした条件表を作って指定します。
「数学が70点以上、または英語が70点以上」のような別フィールドのOR条件を指定する場合は縦並べにして一つ横にずらします。「国語が70点か80点」のような同一フィールドのOR条件は縦並べにします。
分散を求めるエクセル関数の種類
エクセルには分散を計算するための関数が数種類あります。その一覧をまとめました。
関数名 | ライブラリ | 分散の種類 | 仕様 |
---|---|---|---|
VAR.S | 統計 | 不偏分散 | 抜き出した標本の数値を対象に母集団の分散を推定する |
VAR.P | 統計 | 分散 | 母集団の数値を対象に分散を求める |
VARA | 統計 | 不偏分散 | 抜き出した標本のデータを対象に母集団の分散を推定する |
VARPA | 統計 | 分散 | 母集団のデータを対象に分散を求める |
DVAR | データベース | 不偏分散 | 条件を満たすデータから不偏分散を求める |
DVARP | データベース | 分散 | 条件を満たすデータから分散を求める |
DVARはデータベースで条件を指定して不偏分散を求める関数です。不偏分散は母集団(全データ)から標本を抜き出して、それを範囲とします。DVARはデータベース関数で、条件表を別に作成して引数「条件」に指定します。複数の条件を指定することもできます。