Forskjell mellom avvik og standardavvik

Anonim

Avvik vs Standardavvik

Avvik vs Standardavvik

I beskrivende og inferensiell statistikk brukes flere indekser for å beskrive et datasett som svarer til dets sentrale tendens, spredning og skråhet. I statistisk innledning er disse kjent som estimatorer siden de anslår populasjonsparameterverdiene.

Dispersjon er måling av spredning av data rundt sentrum av datasettet. Standardavvik er et av de mest brukte målene for spredning. Avvikene fra hvert datapunkt fra gjennomsnittet tas i betraktning ved beregning av standardavviket. Derfor kan man argumentere for at standardavviket sammen med gjennomsnittet gir et nesten tilstrekkelig bilde om et datasett.

Vurder følgende datasett. Vektene på 10 personer (i kilo) måles til 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Så er den gjennomsnittlige vekten av de ti personene (i kilo) 71 (i kilo).

Hva er avvik?

I statistikk betyr avviket hvor mye et enkelt datapunkt avviger fra en fast verdi som gjennomsnittet. Generelt, la k være en fast verdi og x 1 , x 2 , …, x n angir et datasett. Da er avviket fra x j fra k definert til å være (x j - k).

I de ovennevnte datasettene er for eksempel de respektive avvikene fra gjennomsnittet (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 og (79 - 71) = 8.

Hva er standardavvik?

Når data fra hele befolkningen kan tas i betraktning (for eksempel i tilfelle en folketelling), er det mulig å beregne populasjonsstandardavviket. For å beregne standardavviket for befolkningen, beregnes først avvikene fra dataverdier fra populasjonsmiddelet. Rotenes middelfirkant (kvadratisk gjennomsnitt) av avvik kalles populasjonsstandardavviket. I symboler, σ = √ (Σ (x i -μ) 2 / n} hvor μ er populasjonsmiddelet og n er populasjonsstørrelsen.

Når data fra en prøve (av størrelse n) brukes til å estimere parametere av befolkningen, beregnes standardavviket for prøven. For det første beregnes avvikene fra dataværdier fra prøvens gjennomsnitt. Siden prøven er brukt i stedet for populasjonsmiddelet (som er ukjent), er det ikke hensiktsmessig å ta kvadratisk gjennomsnitt. For å kompensere for bruken av prøvens gjennomsnitt er summen av kvadratene av avvik delt mellom (n-1) i stedet for n. Prøvestandardavviket er kvadratroten av dette.I matematiske symboler, S = √ (Σ (x i -ẍ) 2 / (n-1)}, hvor S er prøve standardavviket, er ẍ prøven gjennomsnittlig og xi er datapunkter.

I forrige datasett er summen av kvadratene av avviket (-1) 2 + (-9) 2 + (-6) 2 + 1- 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Dermed er populasjonsstandardavviket √ (366/10) = 6,05 (i kilo). (Forutsatt at befolkningen under vurdering består av de 10 personer fra hvem dataene ble tatt). Hva er forskjellen mellom avvik og standardavvik? • Standardavvik er en statistisk indeks og en estimator, men avvik er ikke. • Standardavvik er et mål for spredning av en datastamme fra midten, mens avvik refererer til hvor mye et enkelt datapunkt er forskjellig fra en fast verdi.