Standaarddeviatie berekenen om grip te krijgen op data

Tools | Six Sigma

Standaarddeviatie berekenen om grip te krijgen op data

De standaarddeviatie geeft de spreiding aan van de getallen rondom het gemiddelde. Handig als je bijvoorbeeld wilt weten of de gemiddelde leeftijd van respondenten varieert of dat de deelnemers in dezelfde leeftijdscategorie zitten. Voor veel mensen is de standaarddeviatie, ook wel standaardafwijking, een begrip dat ze niet jaarlijks gebruiken. Is dat voor jou ook het geval, maar wil je er nu mee aan de slag? Geen zorgen, wij geven je de nodige context en laten je zien hoe je de standaarddeviatie berekent.

Wat is een standaarddeviatie?

Misschien kun je het je nog herinneren van de wiskundelessen of van het vak statistiek: de docent behandelde in hoog tempo begrippen als boxplot, mediaan, flowchart en de standaarddeviatie. Allemaal onderwerpen die reuze handig zijn om inzicht te krijgen in een dataset zoals de resultaten van een steekproef. De standaardafwijking in het bijzonder is ideaal om meer grip te krijgen op de data. Als je namelijk weet hoe je de standaarddeviatie berekent, weet je al snel hoe de individuele datapunten afwijken van het gemiddelde.

Wanneer gebruik je de standaarddeviatie?

De standaardafwijking is een rekenkundig element dat je dus gebruikt om de spreiding van datasets in kaart te brengen. Dat klinkt leuk, maar in welke situaties biedt de standaarddeviatie nou precies uitkomst? Hieronder vind je enkele voorbeelden.

·       Inzicht in spreiding

Wil je weten of de gegevens in een dataset breed verspreid zijn, of dat waardes juist allemaal dicht bij het gemiddelde liggen? Met de standaardafwijking weet je in een handomdraai of de gegevens variabel of vrij consistent zijn. Overigens ook hele handige informatie om verschillende datasets met elkaar te kunnen vergelijken.

·       Identificeren van uitschieters

Uitschieters in een dataset kunnen al snel een vertroebeld beeld geven. Zeker als de uitschieters een flink effect hebben op het gemiddelde. Om dat te voorkomen kun je gebruikmaken van de mediaan, de middelste waarde, maar het kan ook prettig zijn om de uitschieters snel te identificeren. De standaarddeviatie helpt bij het opsporen van de ongewone waarden. Al kun je hier overigens ook heel eenvoudig een boxplot voor gebruiken.

·       Analyseren van risico’s

Binnen de wereld van de statistiek is de standaardafwijking een veelgebruikt begrip, maar ook beleggers kennen graag de standaarddeviatie. Dit getal geeft namelijk aan hoe de prijzen fluctueren en hoe risicovol een bepaalde belegging is. Hierbij geldt over het algemeen dat hoe hoger de standaardafwijking is, hoe groter het risico is.

Hoe bereken je de standaarddeviatie met Excel?

Nu je weet waarom het handig is om de standaardafwijking te weten, wil je misschien dit getal ook zelf kunnen berekenen. Je kunt natuurlijk aan de slag met ingewikkelde formules, maar wij laten handige programma’s zoals Excel graag het werk voor ons opknappen. Wil jij ook Excel inzetten om de standaardafwijking te berekenen? Volg dan onderstaande stappen.

1.     Zet je data in Excel. In dit geval zetten we de leeftijden van de medewerkers van een koffiezaak in kolom A (rij 3 tot en met 14).

2.     Vervolgens selecteren we een lege cel waarin de standaardafwijking weergegeven mag worden. Wij willen de standaarddeviatie graag tonen in cel B20.

3.     In cel B20 zetten we de volgende formule: =STDEV.P(A3:A14). Hiermee geef je Excel de opdracht om de standaardafwijking uit te rekenen voor de waarden die in cel A3 tot en met A14 staan. Wil je de standaardafwijking via een steekproef meten? Dan wijzig je de formule naar =STDEV.S(A3:A14). Met de eerste formule bereken je dus de standaardafwijking van de totale populatie en bij de tweede formule bereken je die op basis van een steekproef. In dit geval kunnen we prima voor de eerste formule kiezen, omdat de dataset beperkt is. Nadat je de informatie hebt ingevuld, zul je zien dat de standaardafwijking 4,88 is.

voorbeeld standaarddeviatie

Meer grip op data

Grote hoeveelheden data zijn voor veel mensen vaak lastig te interpreteren. Dat is zonde, want juist data kan je ontzettend helpen om processen binnen organisaties beter te stroomlijnen. Het kunnen berekenen van de standaardafwijking kan dan een goede eerste stap zijn. Zo weet je namelijk wat de gemiddelde spreiding is, en kun je dus ook bijvoorbeeld snel zien welke processen gemiddeld veel meer tijd kosten. Waardevolle informatie om bedrijfsprocessen te verbeteren.

Wil je meer over weten hoe om te gaan met data om je processen te verbeteren? Meld je dan aan voor de Process Mining Masterclass of één van onze andere Lean  Six Sigma trainingen. Heb je vragen, neem gerust contact met ons op.

 

Ga naar WhatsApp