Jedním z nejzákladnějších pojmů ve statistice je průměr, nebo aritmetický průměr, množiny čísel. Průměr znamená střední hodnotu pro sadu dat. The odchylka datové sady měří, do jaké míry jsou prvky tohoto souboru dat rozloženy z průměru. Sady dat, ve kterých jsou čísla blízké průměru, budou mít malý rozdíl. Sady, ve kterých jsou čísla mnohem vyšší nebo nižší než průměr, budou mít vysoký rozptyl.
Vypočtěte průměr datové sady
Vypočítat rozdíly v rozdělení
Dalším krokem je výpočet rozdílu mezi každým prvkem v datové sadě a průměrem. Jelikož některé prvky budou vyšší než průměr a některé budou nižší, výpočet rozptylu použije čtverec rozdílů.
Den 1 Prodej - průměrný prodej: 62 000 dolarů - 65414,29 dolarů = (3,414,29 dolarů); (-3,414,29)2 = 11,657,346.94
2.denní prodej - průměrný prodej: 64 800 $ - 65414,29 $ = (- 614,29 USD); (-614,29)2 = 377,346.94
Den 3 Prodej - průměrný prodej: 62.600 dolarů - 65414.29 dolarů = (-2.814,29 dolarů); (-2814,29)2 = 7,920,204.08
4.denní prodej - průměrný prodej: 69,200 dolarů - 65414,29 dolarů = (3,785,71 dolarů); (+3 785,71)2 = 14,331,632.65
5.denní prodej - průměrný prodej: 66 000 USD - 65414,29 USD = (585,71 USD); (+585,71)2 = 343,061.22
6. den prodeje - průměrný prodej: 63 900 - 65414,29 USD = (1 514,29 USD); (-1,514.29)2 = 2,293,061.22
7.denní prodej - průměrný prodej: 69.400 dolarů - 65414.29 dolarů = (3.985,71 dolarů); (+3 985,71)2 = 15,885,918.37
POZNÁMKA: Rozdíly mezi kvadrami nejsou měřeny v USD. Tato čísla jsou použita v dalším kroku pro výpočet rozptylu.
Odchylka a standardní odchylka
Rozdíl je definován jako průměr čtvercových rozdílů.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Vzhledem k tomu, že odchylka používá čtverec rozdílu, druhá odmocnina rozptylu poskytne jasnější indikaci skutečného rozpětí. Ve statistice se druhá odmocnina odchylky nazývá standardní odchylka.
SQRT (7 544 081,63) = 2 746,65 USD
Použití pro odchylku a standardní odchylku
Jak variace, tak standardní odchylka jsou velmi užitečné při statistické analýze. Varianta měří celkové rozložení datového souboru od průměru. Standardní odchylka pomáhá při detekci odlehlé hodnoty, nebo prvky datové sady, které se příliš vzdávají od průměru.
Ve výše uvedeném souboru údajů je rozptyl poměrně vysoký, přičemž pouze dva denní tržby se pohybují kolem 1 000 dolarů. Soubor údajů také ukazuje, že dva ze sedmi denních celkových prodejů jsou více než jedna standardní odchylka nad průměrem, zatímco dvě další jsou více než jedna standardní odchylka pod průměrem.