Statistiek — Normale verdeling — Totaalbeeld

In dit onderwerp is het werken met verdelingen van vooral relatieve frequenties en dan met name de normale verdeling voorbij gekomen. Het gaat daarbij vooral om berekeningen met de normale verdeling, werken met betrouwbaarheidsintervallen en werken met controlekaarten.

Je hebt nu alle theorie van Normale verdeling doorgewerkt. Er moet een totaalbeeld van deze leerstof ontstaan... Ga na, of je al de bij dit onderwerp horende begrippen kent en weet wat je ermee kunt doen. Ga ook na of je de activiteiten die staan genoemd kunt uitvoeren. Maak een eigen samenvatting!

symmetrische en niet-symmetrische frequentieverdelingen standaardafwijking, standaarddeviatievariantienormaalkromme en zijn vuistregels normale verdelingstandaardnormale tabel, -tabel-waarde steekproevenverdelingbetrouwbaarheidsinterval controlekaart, regelkaart, Shewhartkaart beoordelen of een frequentieverdeling symmetrisch is of niet; de standaarddeviatie van een frequentieverdeling berekenen en interpreteren is samenhang met de normaalkrommede vuistregels bij een normaalkromme toepassen; een normale verdeling van relatieve frequenties karakteriseren door gemiddelde en standaarddeviatiebij een normale verdeling relatieve frequenties (percentages) berekenenbij gegeven percentages onder een normaalkromme gemiddelde of standaardafwijking berekenen; de standaardafwijking van een steekproevenverdeling berekenen (de wortel-n-wet)een betrouwbaarheidsinterval voor metingen vaststellen; werken met Shewhartkaarten.

Uit onderzoek van het gemengde boerenbedrijf bleek het houden van kippen een belangrijke rol te spelen bij het tot stand komen van het inkomen van deze boeren. Daarom werd de boeren gevraagd het aantal kippen op hun bedrijf op te geven.

Waarom kun van deze gegevens het gemiddelde en de standaarddeviatie niet exact berekenen?

De gegevens zijn al verdeeld in klassen en je kunt de ruwe data niet meer zien.

Schat de centrummaten mediaan en gemiddelde. Onderbouw je schatting.

De mediaan is het gemiddelde van de 572e en 573e waarneming en valt in het midden van de klasse en is dus .

Voor de schatting van het gemiddelde werk je met de klassenmiddens:

Schat de standaardafwijking. Onderbouw je schatting.

Standaarddeviatie: .

De standaarddeviatie bereken je met Excel: afwijking ten opzichte van (gemiddelde) kwadrateren, vermenigvuldigen met frequentie, optellen, delen door en wortel trekken.

Hoeveel procent van de bedrijven heeft meer dan kippen?

%.

Hoeveel procent van de bedrijven heeft minder dan kippen?

%.

Hoe kun je de verdeling karakteriseren zonder er een diagram van te maken?

Redelijk symmetrisch met één top (in het midden), niet-scheef; benadert een normale verdeling.

Aan de frequentie in de tabel kun je zien dat de top rond kippen ligt en dat links en rechts in de frequentietabel min of meer getallen van gelijke grootte liggen. Er zijn misschien iets meer kleine () dan grote bedrijven ().

Je kunt de verdeling zo karakteriseren: redelijk symmetrisch met één top (in het midden), niet scheef, benadert een normale verdeling.

Bloeddruk wordt gemeten in mm Hg (spreek uit: millimeter kwikdruk).
Bij een groep van duizend Nederlandse mannen is de bloeddruk normaal verdeeld met een gemiddelde van mm Hg met een standaardafwijking van mm Hg.

Hoeveel procent van deze mannen hebben naar schatting een bloeddruk van minder dan mm Hg?

. Maak gebruik van de vuistregels en de symmetrie van de normaalkromme. Dit geeft %.
Je kunt ook werken met de standaardnormale tabel: .

Hoeveel van deze mannen hebben naar schatting een bloeddruk die meer dan twee keer de standaardafwijking afwijkt van de gemiddelde bloeddruk?

Gebruik de tweede vuistregel van de normaalkromme. Dit geeft ongeveer %.

Ook dit kan met de standaardnormale tabel: . En dat is ook ongeveer %.

Schat het percentage van deze mannen dat een bloeddruk heeft van meer dan mm Hg.

, dus ongeveer %.

Op grond van deze steekproef van mannen wil je de gemiddelde bloeddruk van alle Nederlandse mannen voorspellen.

Geef het bijbehorende %-betrouwbaarheidsinterval in één decimaal nauwkeurig.

Bij je voorspelling hoort en .

Het %-betrouwbaarheidsinterval is , dus .

In een fabriek verpakt een machine in kleine zakjes poedermelk voor in de koffie. Elk van die zakjes hoort  gram melkpoeder te bevatten. De fabrikant heeft zijn machine zo afgesteld dat het vulgewicht van deze zakjes normaal is verdeeld met een gemiddelde van  gram en een standaardafwijking van  gram.

Hoeveel procent van de zakjes melkpoeder die deze machine produceert, is te licht?

, dus %.

De fabrikant voldoet hiermee niet aan bepaalde richtlijnen. Die schrijven voor dat niet meer dan % van de zakjes poedermelk minder dan  gram mag bevatten.

De fabrikant besluit om iets meer melkpoeder in de zakjes te doen. Op welk gemiddelde vulgewicht moet hij de machine instellen om aan de richtlijn van de EU te voldoen? Ga ervan uit dat de standaardafwijking van de verdeling van de vulgewichten hetzelfde blijft.

geeft .

Met de -tabel: .

Dus gram.

Je koopt een doosje met daarin twintig zakjes van het melkpoeder dat nog het oorspronkelijke gemiddelde van  gram heeft.

Hoeveel gram melkpoeder verwacht je gemiddeld per zakje in het doosje met twintig zakjes? En welke standaardafwijking hoort daarbij?

Je verwacht gemiddeld  gram met een standaardafwijking van  gram.

Bij een steekproef van een flinke populatie is van pasgeboren baby's is de lengte (in cm) gemeten. De gemiddelde lengte in de steekproef is  cm en voor de standaardafwijking van de lengte geldt .

Bereken het % betrouwbaarheidsinterval van de gemiddelde lengte van de populatie.

%-betrouwbaarheidsinterval loopt van tot .
Dus van tot cm.

Onder de metingen zit een meetfout. Een van de baby's is geen maar cm. Dit heeft gevolgen voor het gemiddelde en voor . Nu is . Bereken het % betrouwbaarheidsinterval opnieuw.

Gemiddelde: alle lengtes bij elkaar is cm.
Het nieuwe gemiddelde is dus cm.

% betrouwbaarheidsinterval tussen en , dus tussen en cm.

Leg uit waarom een meetfout in een kleine steekproef grotere gevolgen heeft voor het betrouwbaarheidsinterval dan een meetfout in een grote steekproef.

Het betrouwbaarheidsinterval verandert als het gemiddelde en/of de standaardafwijking veranderen. Bij een meetfout in een kleine steekproef, veranderen ze meer dan bij een meetfout in een grote steekproef.

Een opdrachtgever eist van een fabrikant dat het gemiddelde gewicht werkzame stof in een partij van flessen met reinigingsmiddel gram is.

De fabrikant test dit door middel van een steekproef. Hij vindt een betrouwbaarheidsinterval met een breedte van  gram voldoende precies bij een betrouwbaarheid van %.

De fabrikant weet dat de standaardafwijking van het gewicht van de werkzame stof bij zijn productieproces gram is.

De fabrikant wil weten hoe groot de steekproefomvang moet zijn om aan deze eisen te kunnen voldoen.

Bereken de minimaal benodigde steekproefomvang.

De breedte van het betrouwbaarheidsinterval moet zijn.

Dus het betrouwbaarheidsinterval is het gemiddelde .

Dus .

Dus .

Je ziet hier een controlekaart van een fabrikant van chips.
Van alle chips mag volgens een Europese referentierichtlijn de hoeveelheid acrylamide niet hoger zijn dan µg/kg. Deze chipsfabrikant probeert zich aan die richtlijn te houden en meet elk half uur de hoeveelheid acrylamide in een steekproef uit zijn productie.

Hoeveel acrylamide bevatten zijn chips gemiddeld volgens de fabrikant?

µg/kg.

Met welke standaarddeviatie rekent de fabrikant?

en geeft µg/kg.

Waar vind je in de figuur de Europese richtlijn terug?

Die wordt weergegeven door de rode horizontale lijn op µg/kg.

Hoe vaak wordt de bovenste waarschuwingslijn overschreden?

Echt overschreden wordt die lijn drie keer. En nog eens drie keer wordt hj bereikt.

Is er volgens deze Shewhartkaart reden om het productieproces bij te stellen? Licht je antwoord toe.

Als je de Westgardregels hanteert is alleen het aantal keren dat de hoeveelheid acrylamide achter elkaar boven µg/kg uitkomt zorgwekkend.