de begrippen hypothese toetsen, nulhypothese, alternatieve hypothese, kritieke gebied, onterecht de nulhypothese verwerpen;
het begrip significantieniveau en de procedure bij hypothese toetsen;
linkszijdige, rechtszijdige, tweezijdige toetsen uitvoeren.
de normale verdeling met zijn vuistregels over het gemiddelde en de standaardafwijking;
percentages en grenswaardes berekenen met de normale verdeling;
de wortel-n-wet gebruiken.

Op een fles frisdrank staat dat de inhoud liter is. Natuurlijk zal de inhoud nooit precies liter zijn. De vulmachine is zodanig afgesteld dat het gemiddelde mL is en de standaardafwijking mL. Het vulgewicht is normaal verdeeld. Nu bevat minder dan % van de flessen te weinig frisdrank.
De fabrikant controleert regelmatig de afstelling van zijn vulmachine door in een steekproef van flessen de gemiddelde inhoud te meten. De fabrikant voert een hypothesetoets uit:
De nulhypothese is de aanname dat mL.
De alternatieve hypothese zegt bijvoorbeeld dat veel kleiner is:
: mL
: mL
Als je mL als alternatief neemt, voer je een linkszijdige toets uit.
Maar je kunt ook : mL nemen, dat is een rechtszijdige toets.
Bij : mL, spreek je van een tweezijdige toets.
In een steekproef van flessen zou het gemiddelde dicht bij mL moeten liggen als de nulhypothese geldt. De standaarddeviatie van de steekproevenverdeling is dan .
Maar er is altijd een kleine kans dat je - ook al geldt de nulhypothese - in je steekproef een gemiddelde vindt dat veel te laag is, onder een bepaalde grens ligt. Die kans is het percentage gevallen
Dit percentage heet het significantieniveau. Als de nulhypothese klopt, dan moet het significantieniveau klein zijn. Vaak wordt % genomen, of zelfs maar %. En dan reken je uit welke waarde van daarbij hoort met de standaardnormale verdeling, de -verdeling.
Bekijk de situatie van het automatisch vullen van -literflessen in de Uitleg. Gebruik het gemiddelde en de standaarddeviatie dat de fabrikant heeft laten instellen.
Bereken de kans dat in een steekproef van flessen het gemiddelde vulgewicht lager dan mL is.
De gemiddelde vulgewichten zijn normaal verdeeld met .
.
(Gebruik de standaardnormale tabel.)
Bereken de waarde van waarvoor geldt als je er van uit gaat dat de nulhypothese waar is.
.
Met de standaardnormale tabel vind je , dus
mL.
Uit het antwoord bij b kun je nu concluderen dat gemiddelde vulgewichten lager dan mL maar in % van de gevallen mogen voorkomen als de nulhypothese waar is. Tref je toch een gemiddeld vulgewicht aan dat kleiner is dan , dan ga je twijfelen of de nulhypothese wel waar is en sterker nog: je verwerpt hem met een betrouwbaarheid van %.
heet het kritieke gebied van de toets.
Waarom hoort bij een significantieniveau van % een betrouwbaarheid van %?
Omdat % het percentage is waarin je een te laag gemiddeld vulgewicht krijgt, is % het percentage waarbij het vulgewicht dicht genoeg bij ligt (of zelfs nog hoger is).
Je neemt : mL en : mL.
Je toetst nu met een significantieniveau van %. Bepaal het bijbehorende kritieke gebied.
.
Met de standaardnormale tabel vind je , dus
mL.
Het kritieke gebied is nu .
Je voert de steekproef uit en vindt mL.
Kun je de nulhypothese nu met % betrouwbaarheid verwerpen? Of met % betrouwbaarheid?
Met % betrouwbaarheid verwerp je hem.
Met % betrouwbaarheid accepteer je hem.
De fabrikant uit de Uitleg zet L ℮ op zijn colaflessen en dit betekent dat er geen flessen mogen voorkomen die minder cola bevatten dan mL.
Laat zien dat het percentage colaflessen dat niet aan de Europese norm voldoet inderdaad vrijwel is.
.
De fabrikant krijgt het vermoeden dat hij wel met een lager vulvolume toekan en laat zijn vulmachines instellen op een gemiddelde van met een standaarddeviatie van mL.
Voldoet hij nog steeds aan de hierboven beschreven norm?
, dus nog wel maar iets minder goed.
De fabrikant test het nieuwe ingestelde vulvolume met een steekproef van flessen. Hij wil een betrouwbaarheid van %.Het gemiddelde vulvolume in de steekproef is mL.
Dus hij toetst : mL tegen : mL.
Bepaal het kritieke gebied van deze toets en leg uit welke conclusie de fabrikant moet trekken.
De standaarddeviatie van de steekproevenverdeling is mL.
dus .
Met de standaardnormale tabel vind je , dus
mL.
Het kritieke gebied is nu .
De conclusie die de fabrikant moet trekken is dat de vulmachine nog niet goed is ingesteld.
Statistische methodes kunnen worden gebruikt om een bewering over een populatie te
controleren. Dit heet
De
De
Stel is normaal verdeeld met gemiddelde en standaardafwijking .
Iemand vertrouwt het gemiddelde niet en vermoedt (bijvoorbeeld) dat het kleiner is dan . Je hebt dan:
Dit wordt getoetst met een steekproef van grootte . Je kijkt of het gemiddelde in de steekproef significant van afwijkt. Het steekproefgemiddelde is normaal verdeeld met en .
Bij deze
.
Het significantieniveau kies je voordat je de toets uitvoert, bijvoorbeeld % of %.
Afhankelijk van de situatie, zijn er nog twee mogelijkheden voor de alternatieve hypothese:
een
een
Volgens de fabrikant is het gewicht (in gram) van zijn pakken suiker normaal verdeeld met g en g.
Omdat de consumentenbond veel klachten heeft binnengekregen waarin wordt gemeld dat de pakken suiker van deze fabrikant te weinig suiker bevatten, wordt er door hen getwijfeld aan dit gemiddelde. De consumentenbond stelt dat het gemiddelde lager is dan g.
In een steekproef van is het gemiddelde g. Is dit bij een significantieniveau van % voldoende reden om aan te nemen dat de fabrikant ongelijk heeft?
De hypothesetoets ziet er zo uit:
:
:
In de steekproef is g en .
Het significantieniveau is en dit betekent: bereken de grenswaarde waarvoor .
geeft: .
Het kritieke gebied wordt daarom: .
Het in de steekproef gevonden gemiddelde geeft daarom inderdaad aanleiding om de bewering van de fabrikant in twijfel te trekken bij een significantieniveau van %.
Je ziet in
Voer de beschreven toets zelf uit, laat duidelijk zien hoe je aan komt.
geeft , dus .
Voer de toets nog eens uit, maar nu met een betrouwbaarheid van %. Is er nog steeds sprake van een significante afwijking?
geeft , dus
.
Er is nog steeds een significante afwijking.
In plaats van een steekproef van pakken wordt een steekproef van pakken suiker genomen. Bij welke gewichten krijgt de consumentenbond nu met % betrouwbaarheid gelijk?
Nu is g en .
geeft , dus
.
De consumentenbond krijgt gelijk als er gemiddeld minder dan gram wordt gevonden.
In het voorbeeld staat dat in een steekproef van het gemiddelde gram is. Laat zien, dat je door te berekenen ook kunt concluderen dat de consumentenbond gelijk heeft.
Nu is g en .
.
Omdat dit betekent dat in het gebied moet liggen met een kleiner percentage dan % (het kritieke gebied), krijgt de consumentenbond gelijk.
Bekijk
De fabrikant wil natuurlijk ook niet teveel suiker in zijn kilopakken stoppen, dat kost geld.
Hij toetst met een steekproef van pakken of het vulgewicht niet te hoog is. Gebruik het ingestelde gemiddelde met de bijbehorende standaardafwijking in het Voorbeeld.
Hoe ziet zijn hypothesetoets er uit?
: .
: .
In zijn steekproef vindt de fabrikant een gemiddelde van g.
Stel met een betrouwbaarheid van % vast of de fabrikant zijn vulmachines zal gaan bijstellen.
Nu is g en .
geeft , dus . Hij hoeft zijn vulmachines niet bij te stellen.
Volgens de fabrikant is het gewicht (in gram) van zijn pakken suiker normaal verdeeld met en .
De fabrikant test zijn vulmachine door van een steekproef van pakken het gemiddelde gewicht te berekenen. Hij doet uiteraard een dubbelzijdige toets.
Wat is het kritieke gebied bij een significantieniveau van %?
De hypothesetoets ziet er zo uit:
:
:
is normaal verdeeld met standaardafwijking .
Het significantieniveau is en dit betekent: bereken de grenswaarden en waarvoor en .
Het significantieniveau wordt vanwege de symmetrie van de normale verdeling in twee gelijke delen verdeeld.
geeft:
geeft:
Het kritieke gebied wordt daarom:
.
Er zijn immers altijd afwijkingen naar boven en naar beneden mogelijk!
In
Waarom is dit een tweezijdige toets? Wat gebeurt er met de onbetrouwbaarheidsdrempel ?
Er wordt naar een afwijking van het gemiddelde zowel naar boven als naar beneden gezocht. De onbetrouwbaarheidsdrempel wordt verdeeld over beide ongelijkheden.
Als er geen duidelijke reden is om dat anders te doen wordt gewoon in twee gelijke delen verdeeld.
Voer de beschreven toets zelf uit.
geeft en dus
geeft en dus .
Om de grenswaarde te berekenen, hoef je niet met de standaardnormale tabel te werken.
Je kunt deze waarde afleiden uit die van en de symmetrie van de grafiek.
Dus .
Bekijk de opmerking onderaan
Welke gevolgen heeft het altijd tweezijdig toetsen op de betrouwbaarheid van je uitspraken?
Die betrouwbaarheid wordt in feite groter omdat je bij een afwijking naar beneden dan maar een significantie van hanteert. En hetzelfde geldt voor een afwijking naar boven.
In een fabriek heeft men het vermoeden dat het koolstofgehalte van een bepaalde staalsoort groter is dan %. In een steekproef van metingen wordt een gemiddelde gevonden van %.
De standaardafwijking van het koolstofgehalte is bekend en bedraagt %.
Formuleer een geschikte nulhypothese en een alternatieve hypothese.
en met .
Toets de hypothese met een significantie van . Wat is je conclusie?
geeft .
Dus wordt verworpen, met een betrouwbaarheid van % kun je zeggen dat het staal een groter koolstofgehalte heeft dan %.
Een firma die batterijen levert voor rekenmachines, beweert dat die batterijtjes geschikt zijn om gemiddeld zo’n apparaat uur te laten werken. Ze gaan er van uit dat die levensduur normaal is verdeeld met een standaarddeviatie van uur.
In een aselect gekozen groep van rekenmachines stop je de batterijen van deze firma. De gemiddelde levensduur blijkt uur te zijn.
Kun je op grond van dit resultaat met een betrouwbaarheid van % de bewering van de firma verwerpen?
Je toetst tegen met .
(Je zou ook een dubbelzijdige toets kunnen doen, maar op grond van het steekproefresultaat ligt een enkelzijdige toets meer voor de hand.)
Nu is en .
geeft .
De gevonden ligt in het kritieke gebied en dus kun je met een betrouwbaarheid van % de bewering van de firma verwerpen.
Volgens een wetenschappelijk tijdschrift is het gewicht van zeventienjarigen normaal verdeeld met een gemiddelde van kg en een standaarddeviatie van kg. Om dit gemiddelde te toetsen wordt van aselect gekozen zeventienjarigen het gewicht bepaald.
Als het gemiddelde gewicht in de steekproef kg is, heeft het tijdschrift dan met een significantie van % gelijk?
, dus wordt verworpen, het tijdschrift heeft niet gelijk.
Bij welk significantieniveau verwerp je de mening van het tijdschrift?
Bij een significantieniveau van ongeveer % of meer.
Bij welk significantieniveau had je de mening van het tijdschrift verworpen als je in een veel kleinere steekproef van zeventienjarigen hetzelfde gemiddelde gewicht had aangetroffen? Kun je een verklaring geven voor het verschil met het antwoord bij b?
Bij een significantieniveau van ongeveer % of meer. De betrouwbaarheid wordt duidelijk kleiner als de steekproef kleiner wordt.
Vacuüm verpakte vleeswaren mogen maximaal % natriumnitriet bevatten. Bij de keuringsdienst van waren controleren ze dit percentage. Bij de metingen is de standaardafwijking %.
Formuleer de hypothese die getoetst wordt. Je mag aannemen dat het natriumnitrietpercentage normaal verdeeld is.
Je toetst tegen .
Is de toets eenzijdig of tweezijdig? Formuleer ook de alternatieve hypothese.
Zie a, het wordt een enkelzijdige toets want kleinere hoeveelheden natriumnitriet zijn acceptabel, grotere niet.
Bij de nulhypothese zijn er nog meer mogelijkheden voor . Omdat zelfs toegestaan is, wordt er uitgegaan van . In een steekproef van stuks verpakte vleeswaren blijkt het nitrietgehalte te zijn.
Toets met behulp van deze steekproef of er reden is tot bezorgdheid. Neem een significantieniveau van %.
Nu is en .
, dus wordt niet verworpen, er is geen reden voor bezorgdheid.
In een medisch laboratorium worden voortdurend cholesterolgehaltes in bloedmonsters bepaald. De gebruikte apparatuur wordt elk uur gecontroleerd met behulp van een ijkmonster. Hiervan is bekend dat het gemiddelde mg per mL zou moeten zijn. De controlemetingen aan het ijkmonster leveren op: , , , , , , , .
Is er met een significantie van reden om aan te nemen dat de meetapparatuur niet goed meer werkt? Neem daarbij aan dat de standaardafwijking van deze controlemetingen overeenkomt met de populatiestandaarddeviatie.
Je toetst tegen met .
In de steekproef is en . Deze gebruik je als standaardafwijking van de populatie.
geeft .
geeft .
De gevonden ligt niet in het kritieke gebied en dus is de afwijking niet statistisch significant.
percentage | frequentie |
3,445 −< 3,455 | 1 |
3,455 −< 3,465 | 0 |
3,465 −< 3,475 | 4 |
3,475 −< 3,485 | 3 |
3,485 −< 3,495 | 3 |
3,495 −< 3,505 | 4 |
3,505 −< 3,515 | 2 |
3,515 −< 3,525 | 2 |
3,525 −< 3,535 | 1 |
Op een pak melk staat:
Volle melk wordt in de fabriek altijd afgeroomd tot %. Een consumentenorganisatie besluit na te gaan of volle melk % vet bevat. In een aselecte steekproef van pakken volle melk vindt ze de percentages die je in de tabel ziet.
Men veronderstelt dat het vetgehalte van pakken melk normaal verdeeld is.
Schat met behulp van deze steekproef de standaarddeviatie van het vetgehalte van volle melk.
en .
Toets met significantieniveau of de consumentenorganisatie op grond van de steekproef de bewering op het pak kan verwerpen.
Nu is en .
, dus wordt verworpen, de consumentenorganisatie kan de bewering van de fabrikant verwerpen.
In een melkfabriek worden flessen machinaal gevuld. De gedoseerde hoeveelheid per fles is normaal verdeeld. Bij juiste instelling is de verwachte hoeveelheid g per fles. Een kwaliteitsinspecteur neemt een steekproef van flessen en vindt voor het gemiddelde g. De populatiestandaardafwijking is g.
Toets, met significantieniveau , g tegen g.
en .
, dus wordt verworpen.
Een partij kobaltchloride wordt bij levering door de ontvanger gekeurd op het gehalte kobalt. Volgens de leverancier is het gehalte %. Hieronder zie je de resultaten van de metingen.
16,2 | 15,8 | 16,1 | 15,8 | 15,9 |
15,9 | 16,2 | 16,1 | 16,2 | 16,0 |
15,8 | 15,9 | 16,1 | 15,8 | 16,0 |
16,0 | 16,0 | 15,9 | 16,2 | 16,2 |
16,0 | 16,1 | 16,0 | 15,9 | 16,3 |
Toets met behulp van deze resultaten of de leverancier gelijk heeft. Je mag aannemen dat het gehalte kobalt normaal verdeeld is. Neem als significantieniveau .
Steekproef: en .
, dus wordt verworpen, het kobaltgehalte is te klein.
Bij het toetsen van hypothesen met de normale verdeling gebruik je de Standaardnormale tabel.
is normaal verdeeld met en .
Van steekproeven van grootte uit deze normale verdeling zijn de gemiddelden normaal verdeeld met gemiddelde en standaardafwijking .
Je berekent nu:
.
