Excel(エクセル)で標準偏差を求める
関係する関数:STDEV.S、STDEV.P
標準偏差(ひょうじゅんへんさ)とは?
標準偏差(英語:Standard Deviation スタンダード ディビエーション 略称:SD)は小文字のσ(シグマ)で表記されます。
「偏差」は平均との差分のことで、データと平均値との距離幅を指します。統計における標準偏差は平均値を基準にしたデータのばらつきの目安となる指標の一つです。
もう少し平たく言うと、平均値からどのくらいの距離にデータが散らばっているかを示す値です。データが平均値からさほど離れずに散らばっていれば「標準偏差」の値は小さく、平均値から距離を持って散らばっていれば「標準偏差」の値は大きくなります。
標準偏差と正規分布のグラフ
データの個数を縦軸に、データの数値を横軸にしてグラフを描くと、多くは左右対称の山型になります。このグラフは「正規分布」といい、平均値を中央にしてプラスマイナス「標準偏差の幅」の範囲にデータの約68%が分布します。標準偏差をレクチャする相手に分かりやすく示すために正規分布などのグラフは効果的です。
標準偏差の値が小さければ、グラフの山型の幅が狭まり、データの密集度が増します。多くのデータが平均値の近くにあるので、品質管理の検査などでは期待通りの結果ということになります。
標準偏差を求めるのはなぜか?
標準偏差を求める理由は第一にデータ分析の指標として優れているという点です。
データ表の数値から「平均値」を計算して分析の基準にしますが、この値はデータの分布状況を反映していません。
あるクラスのテストの平均点が全国平均を上回ったとしても、そのクラスのほとんどの生徒が全国平均以上の実力を持っているとは限りません。一部の優秀な生徒が底上げしている可能性もあるからです。
クラス全体の実際の優劣を判断するには平均値だけでは無理なので、点数がどのように分布しているかを知るための値が必要になります。それが「標準偏差」です。
標準偏差を求める理由の第二は、イメージしやすさ、説明しやすさです。
標準偏差の数値は平均値からデータのばらつきの距離を直感的に把握しやすく、データ分析を説明するのにとても有用なのです。標準偏差と同じく平均値からのばらつきを求める「分散(エクセルの関数ではVAR.S、VAR.P)」という統計量がありますが、標準偏差と分散の決定的な違いは「説得力」にあります。
分散と標準偏差の違い
平均値からのばらつきを計算したいと思ったら、まず「分散」を求めます。「標準偏差」は「分散」に対する平方根の値で、標準偏差と分散は実質同じものです。分散の計算は標準偏差より楽ですが、講義やレポートなどには一般的に標準偏差が使われます。
データの単位は「点数」や「時間」だったり「グラム」だったりします。「分散」はその二乗が単位になります。標準偏差の方は単位がデータと同じなので説明しやすく、数字に説得力を持たせることができます。平均速度が33秒で標準偏差が3.0秒なら、「通常の条件下では30秒から36秒の間での走行が可能です」というような説明ができるわけです。
「分散」については以下の記事で初心者にも分かりやすく解説しています。
標準偏差から何が分かる?
標準偏差で分かることはデータの種類によっていろいろです。標準偏差の使用例を挙げてみましょう。
- 品質管理で原材料の配分をデータ化し、抜き取り検査でサンプルデータの標準偏差を求める
→ 標準偏差の値が小さければ配分が均一であり、品質には問題なしと分かる - 学力テストで各自の点数データから標準偏差を求める
→ 標準偏差の値が大きければ学力の個人差が大きく、担任教師が成績下位の生徒の学習意欲を引き出せていないことが分かる - 試作品のアンケートで評価の点数をもとに標準偏差を求める
→ 標準偏差の値が小さければ一般の評価は平均値とほぼ一致していると分かり、平均値が高ければ発売に踏み切る判断材料になる
標準偏差の2つの種類
標準偏差には「標本標準偏差」と「不偏標準偏差」の2種類あります。
この2つを分けるのは計算するデータの範囲が母集団か標本かです。「母集団」とはデータ全体のことで、「標本」は母集団から無作為抽出したサンプルのことです。
標本標準偏差
母集団を対象に計算するのは「標本標準偏差」、或いは単に「標準偏差」です。データの全てを対象に標準偏差を求めます。母集団が限定的なデータ数である場合に使う計算方法で、膨大なデータベースで使うのは現実的ではありません。
不偏標準偏差
母集団から無作為抽出した標本を対象に計算するのは「不偏標準偏差」です。サンプリングした標本から標準偏差を求めます。企業がデータ分析をする場合の多くは不偏標準偏差が採用されます。前章の例で言えば、抜き取り検査で求める標準偏差は「不偏標準偏差」です。
標準偏差を計算する方法
標準偏差を求めるには、まず「分散」を計算しますが、この計算式は「標本標準偏差」と「不偏標準偏差」で違いがあります。
分散と標準偏差の計算式
「標本標準偏差」の場合の分散の計算式は、個々のデータから平均値を引いた値の二乗を全て足し算し、データの個数で割り算します。
「不偏標準偏差」の場合の分散の計算式は、個々のデータから平均値を引いた値の二乗を全て足し算し、データの個数から1を引いた数で割り算します。
※サンプリングで計算する不偏標準偏差では標本の数が母集団より少ないことから、割る数に「-1」を入れて補正します。
「分散」の数値に対する平方根が「標準偏差」ですから、分散値を入力してから√(ルート)を押せば、電卓でも計算できます。
Excel(エクセル)の関数で標準偏差を求める
Excelには標準偏差を簡単に求めることができる関数が数種類用意されています。
STDEVP/STDEV.P関数
母集団全体を範囲にして数値を対象に標準偏差を求める関数です。
数値で標本標準偏差を求めるSTDEV.P(STDEVP)関数の計算方法、使用例を分かりやすく解説しています。

STDEV/STDEV.S関数
母集団から無作為抽出したサンプルを範囲にして数値を対象に標準偏差を求める関数です。
数値で不偏標準偏差を求めるSTDEV.S(STDEV)関数の使い方、使用例を分かりやすく解説しています。

STDEVPA関数
母集団全体を範囲にして数値だけでなく文字列・論理値も対象に標準偏差を求める関数です。
データで標本標準偏差を求めるSTDEVPA関数の計算方法、使用例を分かりやすく解説しています。

STDEVA関数
母集団から無作為抽出したサンプルを範囲にして数値だけでなく文字列・論理値も対象に不偏標準偏差を求める関数です。
データで不偏標準偏差を求めるSTDEVA関数の使い方、使用例を分かりやすく解説しています。

DSTDEVP関数
条件を指定して、母集団全体を範囲に標準偏差を求める関数です。
条件を指定して標本標準偏差を求めるDSTDEVP関数の計算方法、使用例を分かりやすく解説しています。

DSTDEV関数
条件を指定して、母集団から無作為抽出したサンプルを範囲に不偏標準偏差を求める関数です。
条件を指定して不偏標準偏差を求めるDSTDEV関数の使い方、使用例を分かりやすく解説しています。
