Excel(エクセル)VAR/VAR.S関数の使い方|数値で不偏分散を求める
使用関数:VAR、VAR.S
分散については以下の記事で詳しく解説しています
VAR/VAR.S関数とは?
VAR関数はExcel2010以降、VAR.S関数に置き換わっています。この関数は「統計」ではなく、「互換性」に格納されています。
使い方はVAR.S関数と同じです。
VAR.S(バリアンス・エス)関数は母集団(分散を求める全データ)からサンプル(標本)を無作為に抜き取り、それを対象範囲にして分散を計算します。VARは分散を意味するVariance(バリアンス)の略。「S」はSample(サンプル=標本)の頭文字です。
データを無作為に抽出して分散を求め、その結果から母集団の分散値を推測します。VAR.Sで求めた値を「不偏分散」といいます。膨大なデータ数の案件を分析するのに適した分散関数です。
VAR.S関数で不偏分散を計算する
「数式」タブ→「関数ライブラリ」→「その他の関数」→「統計」→VAR.Sで関数の引数ダイアログボックスが開きます。
VAR.S関数の引数を指定する
VAR.Sの引数の構成は以下の通りです。「数値1」だけが必須で「数値2」以降は任意、「数値255」まで指定できます。
「商品1」と「商品2」の2つの商品を試食して100点満点で評価した点数の表です。平均値はどちらも「72点」です。
VAR.Sの引数「数値1」に分散を求める範囲をドラッグで指定しました。
離れたセル、飛び飛びのセル範囲なら「=VAR.S(B2,B3,C4)」のように半角カンマで区切って指定します。
商品2にオートフィルコピーして不偏分散を計算しました。以下が結果です。
VAR.S関数で求めた不偏分散でばらつきの大きい小さいを比較する
前章で求めた不偏分散の値を比較してみましょう。
商品1の不偏分散は482.5、商品2の不偏分散は32.5で、大きな差があることが分かります。
商品1は人によって高評価と低評価に大きく分かれるということで万人受けはしないでしょう。商品2は良くも悪くも評価が一定しているようです。
不偏分散は大小の比較サンプルが多いほど母集団(全データ)の正確な状況が判断できます。
分散を求めるエクセル関数の種類
エクセルには分散を計算するための関数が数種類あります。その一覧をまとめました。
関数名 | ライブラリ | 分散の種類 | 仕様 |
---|---|---|---|
VAR.S | 統計 | 不偏分散 | 抜き出した標本の数値を対象に母集団の分散を推定する |
VAR.P | 統計 | 分散 | 母集団の数値を対象に分散を求める |
VARA | 統計 | 不偏分散 | 抜き出した標本のデータを対象に母集団の分散を推定する |
VARPA | 統計 | 分散 | 母集団のデータを対象に分散を求める |
DVAR | データベース | 不偏分散 | 条件を満たすデータから不偏分散を求める |
DVARP | データベース | 分散 | 条件を満たすデータから分散を求める |
VAR.P(標本分散)とVAR.S(不偏分散)の違い
VAR.Sの他に分散を求めるVAR.Pという関数があります。
VAR.Sは母集団からサンプルを抜き出して分散を計算しますが、VAR.P関数は母集団(分散を求める全データ)すべてを対象に分散を計算します。一般的には分析データとしての利便性に優れたVAR.S関数が多く使われます。
VAR.S関数で計算する「分散」とは平均値からのデータのばらつきの目安となる指標です。VAR.S関数は母集団(全データ)からサンプル(標本)を無作為に抜き出し、それを範囲として分散を求めます。VAR.S関数で求めた分散を「不偏分散」と呼びます。(同じ統計関数で分散を求めるVAR.P関数は母集団を範囲として計算します)
VAR.S関数は数値を対象に計算し、文字列・論理値・空白は無視されます。
Excel2007まではVAR関数でしたが、Excel2010からはVAR.S関数に置き換わっています。