Hoppa till innehållet

Standardavvikelse

Från Wikipedia
Diagram över en normalfördelning, där varje färgat band har en bredd lika med en standardavvikelse σ. De mörkaste bandens area representerar sannolikheten (cirka 68 %) för att ett slumpmässigt utfall befinner sig inom en standardavvikelse från medelvärdet
Animation som visar ett, två samt tre standardavvikelser (SD) från medelvärdet på en påhittad datamängd.

Standardavvikelse eller standarddeviation är ett statistiskt mått på hur mycket de olika värdena för en population avviker från medelvärdet. Om de olika värdena ligger samlade nära medelvärdet blir standardavvikelsen låg, medan värden som är spridda långt över och under medelvärdet bidrar till en hög standardavvikelse. Standardavvikelser används inom statistik, forskning och matematisk statistik.

Definitioner

[redigera | redigera wikitext]

Låt X vara en stokastisk variabel med medelvärdet μ enligt

där operatorn E betecknar medelvärdet eller väntevärdet av X. Då är standardavvikelsen av X

Variansen för X definieras som

och således är standardavvikelsen σ (sigma) kvadratroten ur variansen för X, det vill säga är kvadratroten ur medelvärdet av (X − μ)2.

En fördel med kvadratrotsbildningen är att standardavvikelsen fås i samma enhet som mätvärdena.

Diskret slumpvariabel

[redigera | redigera wikitext]

Om X består av slumpvisa värden x1, x2, ..., xN, med likformig sannolikhetsfördelning, är standardavvikelsen för dessa

där

eller, med annan notation

Detta är korrekt om de N värdena utgör hela populationen. Om däremot värdena är en delmängd av en större population och används som estimat av den större populationen är stickprovets standardavvikelse

ett bättre estimat (Bessels korrektion) eftersom den då blir väntevärdesriktig.[1][2]

Om sannolikhetsfördelningen inte är likformig, antag att xk har sannolikheten pk och standardavvikelsen kan i detta fall skrivas

Kontinuerlig slumpvariabel

[redigera | redigera wikitext]

Standardavvikelsen för en kontinuerlig stokastisk variabel X med täthetsfunktionen p(x) är

med

där integralerna är begränsade och där x antar alla värden som är möjliga för den stokastiska variabeln X.

Antag att en population utgörs av

De åtta datapunkterna har medelvärdet

Först beräknas skillnaden för varje datapunkt och medelvärdet och sedan kvadreras resultaten:

Variansen är medelvärdet av dessa värden:

och populationens standardavvikelse är lika med variansens kvadratrot:

  1. ^ Weisstein, Eric W., "Bessel's Correction", MathWorld. (engelska)
  2. ^ Gunnar Blom, Jan Enger, Gunnar Englund, Jan Grandell, Lars Holst (2017). Sannolikhetsteori och statistikteori med tillämpningar (7:1). sid. 228. ISBN 978-91-44-12356-1 

Externa länkar

[redigera | redigera wikitext]