De mediaan is de middelste waarde van een reeks getallen die je sorteert van laag naar hoog. Soms is het handiger om te kijken naar de mediaan in plaats van het gemiddelde. Wanneer dat zo is en hoe je dit onderdeel van de statistiek inzet om bedrijfsprocessen te verbeteren, lees je in dit artikel.
Hoe bereken je de mediaan?
Laten we beginnen bij het begin: hoe bereken je de mediaan? Hoewel, berekenen is misschien niet helemaal het juiste woord. Beter is misschien: hoe vind je de mediaan? Daarvoor zet je eerst alle waarden op volgorde van klein naar groot of van groot naar klein, dat maakt niet uit. Bevat je reeks een oneven aantal, dus bijvoorbeeld 13 getallen in totaal, dan is de mediaan het zevende getal. Je hebt dan immers 6 getallen links van de mediaan en 6 getallen rechts van de mediaan.
Bij een even aantal, bijvoorbeeld 10 getallen, neem je het gemiddelde van de middelste twee getallen. In dit geval van de getallen die op plek 5 en 6 staan. Hieronder twee voorbeelden om dat te demonstreren:
Mediaan van een reeks van 13 getallen:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
10 | 12 | 24 | 33 | 35 | 45 | 48 | 51 | 62 | 64 | 77 | 80 | 83 |
In dit voorbeeld is 48 de mediaan van deze reeks.
Mediaan van een reeks van 10 getallen:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
10 | 12 | 24 | 33 | 35 | 45 | 48 | 51 | 62 | 64 |
In dit voorbeeld is 40 de mediaan van deze reeks (35+45/2).
Wanneer is de mediaan handig om te gebruiken?
Bij het verbeteren van een proces wil je weten hoe een proces presteert. Je wil bijvoorbeeld weten hoeveel tijd een callcenter doet over de telefoongesprekken. Je voert daarom een aantal metingen uit en je hebt dus een dataset. De gegevens in die dataset wil je daarna samenvatten en daarvoor kun je onder andere het gemiddelde en de mediaan gebruiken. In het voorbeeld van het callcenter zou de gemiddelde tijdsduur van een gesprek 5 minuten kunnen zijn en de mediaan van de tijdsduur 4,9 minuten.
Als je dataset symmetrisch verdeeld is, dus zonder al te veel uitschieters naar boven of naar beneden, liggen de mediaan en het gemiddelde dicht bij elkaar. In dat geval gebruiken we meestal het gemiddelde. Als er wel uitschieters zijn liggen de mediaan aan het gemiddelde verder uit elkaar en dan gebruiken we eerder de mediaan. Uitschieters hebben meer invloed op het gemiddelde dan op de mediaan.
Kijk eens naar deze twee datasets. De rechter set heeft wat uitschieters aan de bovenkant.
De linker set heeft gemiddelde 4,8 en mediaan 4,9. De rechter set heeft gemiddelde 5,3 en mediaan 4,9. Je ziet dat de uitschieters het gemiddelde veranderen maar de mediaan niet veranderen.
Laten we dat nog eens toelichten aan de hand van het voorbeeld van de reeks van 13 getallen hierboven. We hadden al gezien dat de mediaan van die reeks 48 is. Nu wil het toeval dat het gemiddelde (624/13) ook 48 is. Stel dat je nu het laatste getal verandert in 390: een flinke uitschieter dus. Dan blijft de mediaan 48, maar gaat je gemiddelde ineens omhoog naar (931/13=) 71,62. Ergens tussen plek 10 en 11 dus in de reeks die je gesorteerd hebt van laag naar hoog. Op zo’n moment is het dus zinvoller om naar de mediaan te kijken.
De mediaan en Lean Six Sigma
Nu je weet hoe je de mediaan berekent en wanneer het handig is om de mediaan als waarde te gebruiken, blijft de vervolgvraag natuurlijk: hoe zet ik de mediaan dan in bij procesoptimalisaties? Het antwoord daarop vinden we eigenlijk terug in de basis van six sigma. Deze methodiek voor procesverbeteringen is sterk datagestuurd en dan is het heel erg handig als je iets weet van statistiek en hoe je dat in kunt zetten om de huidige processen te analyseren en zo te achterhalen waar verbeteringen mogelijk zijn. De mediaan is dan één van de manieren om een dataset samen te vatten wanneer je dataset niet ‘normaal’ verdeeld is.
Meer weten over statistiek en Lean Six Sigma?
Als we je bestoken met termen als tachtig percentiel of variantie, begin je dan spontaan te zweten en vlekken in je nek te ontwikkelen? Dan is het slim om (één van) onze Lean Six Sigma trainingen te volgen. In deze trainingen bouwen we het statistiekgedeelte rustig op. Tegelijkertijd leer je met behulp van data processen en resultaten te verbeteren. Ben je op zoek naar alleen een statistiek-training? Dan is onze training Minitab Basis een goed begin. Neem dan eens een kijkje bij onze Lean Six Sigma trainingen.
Heb je vragen over het analyseren van je data of over onze Lean Six Sigma trainingen neem gerust contact met ons op.