Стандартное отклонение — это средняя величина изменчивости в вашем наборе данных. Он сообщает вам, в среднем, насколько далеко каждое значение находится от среднего.
Высокое стандартное отклонение означает, что значения, как правило, далеки от среднего, а низкое стандартное отклонение означает, что значения сгруппированы близко к среднему.
Что вам говорит стандартное отклонение?
Стандартное отклонение является полезной мерой разброса для нормальных распределений.
В нормальном распределении данные распределены симметрично без перекоса. Большинство значений группируются вокруг центральной области, при этом значения сужаются по мере удаления от центра. Стандартное отклонение показывает, насколько в среднем разбросаны ваши данные от центра распределения.
Многие научные переменные подчиняются нормальному распределению, включая рост, результаты стандартизированных тестов или рейтинги удовлетворенности работой. Когда у вас есть стандартные отклонения различных выборок, вы можете сравнить их распределения с помощью статистических тестов, чтобы сделать выводы о более крупных популяциях, из которых они взяты.
Эмпирическое правило
Стандартное отклонение и среднее вместе могут сказать вам, где находится большинство значений в вашем распределении, если они подчиняются нормальному распределению.
Эмпирическое правило, или правило 68-95-99,7 , говорит вам, где лежат ваши ценности:
- Около 68% баллов находятся в пределах 1 стандартного отклонения от среднего,
- Около 95% баллов находятся в пределах 2 стандартных отклонений от среднего,
- Около 99,7% баллов находятся в пределах 3 стандартных отклонений от среднего.
Эмпирическое правило — это быстрый способ получить обзор ваших данных и проверить любые выбросы или экстремальные значения, которые не соответствуют этому шаблону.
Для ненормальных распределений стандартное отклонение является менее надежной мерой изменчивости и должно использоваться в сочетании с другими показателями, такими как диапазон или межквартильный диапазон.
Формулы стандартного отклонения для популяций и выборок
Для расчета стандартных отклонений используются разные формулы в зависимости от того, есть ли у вас данные по всей совокупности или по выборке.
Шаги для расчета стандартного отклонения
Стандартное отклонение обычно рассчитывается автоматически любым программным обеспечением, которое вы используете для статистического анализа. Но вы также можете рассчитать его вручную, чтобы лучше понять, как работает формула.
Существует шесть основных шагов для нахождения стандартного отклонения вручную. Мы будем использовать небольшой набор данных из 6 баллов, чтобы пройти этапы.
Набор данных | |||||
---|---|---|---|---|---|
46 | 69 | 32 | 60 | 52 | 41 |
Шаг 1 : Найдите среднее
Чтобы найти среднее значение, сложите все баллы, а затем разделите их на количество баллов.
Среднее (x̅) |
---|
Шаг 2 : Найдите отклонение каждой оценки от среднего
Вычтите среднее из каждой оценки, чтобы получить отклонения от среднего.
Поскольку x̅ = 50, здесь мы отнимаем по 50 от каждого балла.
Счет | Отклонение от среднего |
---|---|
46 | 46 – 50 = -4 |
69 | 69 – 50 = 19 |
32 | 32 – 50 = -18 |
60 | 60 – 50 = 10 |
52 | 52 – 50 = 2 |
41 | 41 – 50 = -9 |
Шаг 3 : Возведение в квадрат каждого отклонения от среднего
Умножьте каждое отклонение от среднего само на себя. Это приведет к положительным числам.
Квадрат отклонения от среднего |
---|
(-4) 2 = 4 × 4 = 16 |
19 2 = 19 × 19 = 361 |
(-18) 2 = -18 × -18 = 324 |
10 2 = 10 × 10 = 100 |
2 2 = 2 × 2 = 4 |
(-9) 2 = -9 × -9 = 81 |
Шаг 4 : Найдите сумму квадратов
Сложите все квадраты отклонений. Это называется сумма квадратов.
Сумма площадей |
---|
16 + 361 + 324 + 100 + 4 + 81 = 886 |
Шаг 5: Найдите дисперсию
Разделите сумму квадратов на n – 1 (для выборки) или N (для генеральной совокупности) – это и есть дисперсия.
Поскольку мы работаем с размером выборки 6, мы будем использовать n – 1, где n = 6.
Дисперсия |
---|
Шаг 6 : Найдите квадратный корень из дисперсии
Чтобы найти стандартное отклонение, мы берем квадратный корень из дисперсии.
Стандартное отклонение |
---|
Узнав, что SD = 13,31, мы можем сказать, что каждая оценка отклоняется от среднего значения в среднем на 13,31 балла.