【Excel】エクセル 応用編 STDEV.PとSTDEV.S関数で標準偏差の計算・求め方・データ分析

このページでは、ExcelのSTDEV.P関数を使用して母集団全体に基づいて標準偏差を計算する方法、およびExcelのSTDEV.S関数を使用してサンプルに基づいて標準偏差を推定する方法について説明します。

 

 

 

 

標準偏差とは何ですか?

標準偏差は、数値が平均値からどれだけ離れているかを示す数値です。

 

標準偏差とは、統計学の分野において複数データ間のばらつきの大きさを示す値です。一般的にσ(シグマ)、もしくは5で表され、算出には以下の公式を用います。

hyoujyun

各データの数値からデータ全体の平均を差し引いた値の二乗を合計し、さらにデータの総数で割った値の正の平方根が標準偏差です。

標準偏差と同じようにデータのばらつきを示す「分散」という値が存在します。基本的な公式の成り立ちはまったく同じですが、標準偏差が最終的に正の平方根を求めるのに対し、分散の算出では平方根を求めません。つまり、分散は標準偏差を二乗した値ということになります。

標準偏差は最終的な単位がデータと同次元ですが、分散は単位についても二乗となります。そのため、現実に存在するデータのばらつきを測定する際は、データと同次元でイメージがしやすい標準偏差が用いられる傾向があるようです。

 

1.たとえば、以下の数値の平均(平均)は10です。

Excelのゼロの標準偏差

説明:数字はすべて同じで、変化がないことを意味します。その結果、数値の標準偏差はゼロになります。STDEV関数は古い関数です。Microsoft Excelでは、まったく同じ結果を生成する新しいSTEDV.S関数を使用することをお勧めします。

2.以下の数値の平均(平均)も10です。

Excelの低標準偏差

説明:数値は平均に近いです。その結果、数値の標準偏差は低くなります。

3.以下の数値の平均(平均)も10です。

Excelの高標準偏差

説明:数字は広がっています。その結果、数値の標準偏差は大きくなります。

 

 

 

STDEV.P

ExcelのSTDEV.P関数(PはPopulationを表します)は、母集団全体に基づいて標準偏差を計算します。たとえば、5人の学生のグループを教えています。すべての生徒のテストスコアがあります。母集団全体は5つのデータポイントで構成されています。STDEV.P関数は、次の式を使用します。

全人口に基づく標準偏差の式

この例では、x 1 = 5、x 2 = 1、x 3 = 4、x 4 = 6、x 5 = 9、μ= 5(平均)、N = 5(データポイントの数)。

1.平均(μ)を計算します。

平均を計算する

2.各数値について、平均までの距離を計算します。

平均までの距離

3.各数値について、この距離を二乗します。

平均距離の二乗

4.これらの値を合計(∑)します。

これらの値を合計する

5.データポイントの数で割ります(N = 5)。

データポイントの数で除算する

6. 平方根を取得します。

人口全体に基づく標準偏差

7.幸いなことに、ExcelのSTDEV.P関数はこれらすべてのステップを実行できます。

ExcelのSTDEV.P関数

STDEV.S

ExcelのSTDEV.S関数(SはSampleを表します)は、サンプルに基づいて標準偏差を推定します。たとえば、大規模な学生グループを教えているとします。あなたは唯一の 5人の生徒のテストの点数を持っています。サンプルサイズは5です。STDEV.S関数は次の式を使用します。

サンプルに基づく標準偏差の式

この例では、x 1 = 5、x 2 = 1、x 3 = 4、x 4 = 6、x 5 = 9(上記と同じ数値)、x̄= 5(サンプル平均)、n = 5(サンプルサイズ) 。

1.上記の手順1〜5を繰り返しますが、手順5ではNではなくn-1で除算します。

n-1で除算

2. 平方根を取得します。

サンプルに基づく標準偏差

3.幸いなことに、ExcelのSTDEV.S関数はこれらすべてのステップを実行できます。

ExcelのSTDEV.S関数

注:サンプルに基づいて標準偏差を推定するときに、nではなくn-1で割るのはなぜですか?ベッセルの補正では、nの代わりにn-1で除算すると、標準偏差をより適切に推定できるとされています。

 

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です