使用関数:VARA
分散については以下の記事で詳しく解説しています
VARA関数とは?
VARA(バリアンス・エー)関数はデータ(数値・文字列・論理値)の不偏分散を求めるエクセルの関数です。母集団(分散を求める全データ)からサンプル(標本)を無作為に抜き取り、それを対象範囲にして分散を計算します。VARは分散を意味するVariance(バリアンス)の略です。
VARAに限らず、末尾にAが付くExcelの関数では、数値だけでなく文字列・論理値も計算の対象になります。
- 文字列・論理値のFALSE:0として計算されます
- 論理値のTRUE:1として計算されます
データを無作為に抽出して分散を求め、その結果から母集団の分散値を推測します。VARAで求めた値を「不偏分散」といいます。膨大なデータ数の案件を分析するのに適した分散関数です。
VARA関数で不偏分散を計算する
「数式」タブ→「関数ライブラリ」→「その他の関数」→「統計」→VARAで関数の引数ダイアログボックスが開きます。
VARA関数の引数を指定する
VARAの引数の構成は以下の通りです。引数は数値ではなく、「値1」「値2」・・・です。「値1」だけが必須で「値2」以降は任意、「値255」まで指定できます。
会員特典の利用回数を比較した表でVARAを実行してみましょう。以下の表データは全会員から無作為に抽出したものです。データの中には「利用なし」の文字列が含まれています。
VARPAの引数「値1」に分散を求める範囲をドラッグで指定しました。
離れたセル、飛び飛びのセル範囲なら「=VARA(B4,B8,C5)」のように半角カンマで区切って指定します。
特典Bにもオートフィルコピーして標本分散を計算しました。以下が結果です。
VARA関数で求めた不偏分散でばらつきを比較する
ここでの注目はVARA関数で得た分散同士の比較ではなく、VARA関数とVAR.S関数の比較です。
文字列を無視するVAR.S関数と文字列を「0」として計算するVARA関数では、特典A・B共にVARAの方のばらつきの数値が大きくなっています。このような表では利用がない状況を無視すると正確な分析データになりません。こうしたケースでは「利用なし」を数値化して分散の計算に加えるVARA関数を使います。
分散を求めるエクセル関数の種類
エクセルには分散を計算するための関数が数種類あります。その一覧をまとめました。
関数名 | ライブラリ | 分散の種類 | 仕様 |
---|---|---|---|
VAR.S | 統計 | 不偏分散 | 抜き出した標本の数値を対象に母集団の分散を推定する |
VAR.P | 統計 | 分散 | 母集団の数値を対象に分散を求める |
VARA | 統計 | 不偏分散 | 抜き出した標本のデータを対象に母集団の分散を推定する |
VARPA | 統計 | 分散 | 母集団のデータを対象に分散を求める |
DVAR | データベース | 不偏分散 | 条件を満たすデータから不偏分散を求める |
DVARP | データベース | 分散 | 条件を満たすデータから分散を求める |
VARA関数で計算する「分散」とは平均値からのデータのばらつきの目安となる指標です。VARA関数は数値だけでなく、文字列・論理値も含めて対象とし、母集団(全データ)から標本を抜き出して、それを範囲とする分散を求めます。VARA関数で求めた分散をExcelでは「不偏分散」と呼びます。同じく、空白以外のデータで分散を求めるVARPA関数は母集団(全データ)すべてを範囲として分散を計算します。