Et af de mest grundlæggende begreber i statistik er gennemsnittet eller aritmetiske gennemsnit, af et sæt tal. Middelværdien betyder en central værdi for datasættet. Det varians af et datasæt måler, hvor langt elementerne i datasættet spredes ud fra gennemsnittet. Datasæt, hvor tallene er alle tæt på middelværdien, vil have en lav varians. De sæt, hvor tallene er meget højere eller lavere end gennemsnittet, vil have en høj varians.
Beregn Middel af datasættet
Beregn kvadratiske forskelle
Det næste trin indebærer beregning af forskellen mellem hvert element i datasættet og middelværdien. Da nogle elementer vil være højere end middelværdien og nogle vil være lavere, bruger variansberegningen kvadratet af forskellene.
Dag 1 Salg - Gennemsnitlig Salg: $ 62,000 - $ 65414.29 = (- $ 3.414.29); (-3,414.29)2 = 11,657,346.94
Dag 2 Salg - Gennemsnitlig Salg: $ 64.800- $ 65414.29 = (- $ 614.29); (-614,29)2 = 377,346.94
Dag 3 Salg - Gennemsnitlig salg: $ 62.600 - $ 65414.29 = (- $ 2.814.29); (-2,814.29)2 = 7,920,204.08
Dag 4 Salg - gennemsnitlig salg: $ 69,200 - $ 65414,29 = (+ $ 3,785,71); (+3,785.71)2 = 14,331,632.65
Dag 5 Salg - Gennemsnitlig salg: $ 66.000 - $ 65414.29 = (+ $ 585.71); (585,71)2 = 343,061.22
Dag 6 Salg - gennemsnitlig salg: $ 63,900 - $ 65414,29 = (- $ 1,514,29); (-1,514.29)2 = 2,293,061.22
Dag 7 Salg - gennemsnitlig salg: $ 69.400 - $ 65414.29 = (+ $ 3.985.71); (+3,985.71)2 = 15,885,918.37
BEMÆRK: De kvadrede forskelle måles ikke i dollars. Disse tal anvendes i næste trin for at beregne variansen.
Varians og standardafvigelse
Variansen er defineret som middelværdien af de kvadratiske forskelle.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Da variansen bruger kvadratet af forskellen, vil kvadratrotten af variansen give en klarere indikation af den faktiske spredning. I statistik kaldes kvadratroten af variansen standardafvigelse.
SQRT (7,544,081,63) = $ 2,746,65
Anvendes til variation og standardafvigelse
Både varians og standardafvigelse er yderst nyttige i statistisk analyse. Variansen måler den samlede spredning af et datasæt fra middelværdien. Standardafvigelsen hjælper med at registrere outliers, eller elementer i datasættet, der strayder for langt fra gennemsnittet.
I datasættet ovenfor er variansen ret høj, med kun to daglige salgstotaler, der kommer til inden for $ 1.000 af middelværdien. Datasættet viser også, at to af de syv daglige salgstotaler er mere end en standardafvigelse over gennemsnittet, mens to andre er mere end en standardafvigelse under gennemsnittet.