werken met Student's t-verdeling bij kleine steekproeven;
betrouwbaarheidsintervallen beschrijven met de t-verdeling;
hypothese toetsen met de t-verdeling.
werken met de normale verdeling;
de begrippen hypothese toetsen, nulhypothese, alternatieve hypothese, kritieke gebied, onterecht de nulhypothese verwerpen;
het begrip significantieniveau en de procedure bij hypothese toetsen;
linkszijdige, rechtszijdige, tweezijdige toetsen uitvoeren.

Op een fles frisdrank staat dat de inhoud liter is. Natuurlijk zal de inhoud nooit precies liter zijn. De vulmachine is zo precies mogelijk afgesteld op een gemiddeld vulvolume van mL is. Het vulgewicht is normaal verdeeld.
De fabrikant controleert regelmatig de afstelling van zijn vulmachine door in een steekproef van flessen de gemiddelde inhoud te meten. Hij wil daarmee de nulhypothese : mL toetsen tegen de alternatieve hypothese : .
De fabrikant meet in een aselecte steekproef van gevulde flessen het volume. Hij vindt een gemiddeld volume van mL met een standaardafwijking van mL.
Hoe nu verder?
Als de nulhypothese klopt is het gemiddelde vulvolume normaal verdeeld met en . Maar helaas is de populatiestandaardafwijking niet bekend.
De enige standaardafwijking die bekend is, is ml en die zal niet gelijk zijn aan , zeker bij kleine steekproeven.
De Britse statisticus William Gosset (1876 - 1937) bedacht de zogenaamde -verdeling. Deze verdeling lijkt op de standaardnormale -verdeling, alleen wordt de standaardafwijking gebruikt.
Omdat deze statisticus onder de naam
En met behulp van een tabel voor de -verdeling kun je nu gewoon de hypothese toetsen.
Bekijk de situatie van het automatisch vullen van -literflessen in de Uitleg.
Leg uit, dat volgens de -verdeling .
Nu geldt .
En verder is .
Omdat de waarde van afhangt van de steekproefgrootte , zijn er voor verschillende -tabellen. In deze t-tabel in Excel kun je eerst instellen.
Ga na, dat .
Gebruik het werkblad met opschrift en zorg dat daar eerst de juiste waarde voor staat. Lees vervolgens op dezelfde manier af als in de standaardnormale tabel.
Welke conclusie moet de fabrikant nu trekken bij een significantieniveau van %?
Er is sprake van een dubbelzijdige toets, dus het significantieniveau moet worden verdeeld in twee gebieden van %.
Omdat % is, ligt niet in het kritieke gebied van de toets (want % is niet kleiner dan %). Dus hij mag aannemen dat zijn vulmachine goed is afgesteld.
Stel je voor dat de steekproef niet flessen, maar flessen betreft en dat hetzelfde gemiddelde en standaarddeviatie zijn gevonden.
Hoe groot is nu volgens de -verdeling? En welke conclusie moet de fabrikant dan trekken?
Nu is .
Omdat % is, ligt nog steeds niet in het kritieke gebied van de toets (want % is niet kleiner dan %). Dus hij mag nog steeds aannemen dat zijn vulmachine goed is afgesteld.
En hoe zit dat bij ?
Nu is .
Omdat % is, ligt nu wel in het kritieke gebied van de toets (want % is kleiner dan %). Dus hij mag nu niet meer aannemen dat zijn vulmachine goed is afgesteld.
Vergelijk de standaardnormale -tabel met een -tabel met grote waarden voor .
Is er veel verschil?
Voor grote waarden van zijn beide tabellen vrijwel hetzelfde.
Het gemakkelijkst vergelijk je de tabellen voor negatieve - en -waarden. Voor positieve -waarden moet je er rekening mee houden dat dan het gebied rechts van de grens is gegeven, terwijl bij de -tabel het gebied links van de grens wordt gegeven!
Student's -verdeling wordt veel gebruikt om bij hypothese toetsen het kritieke gebied te bepalen bij een kleine steekproef van grootte .
Daarbij gebruik je deze Student-t-tabel.
Je ziet daarin bij een bepaalde betrouwbaarheid en bij een bepaalde de waarde van .
wordt het aantal vrijheidsgraden genoemd.
In de Uitleg gaat het over een dubbelzijdige (tweezijdige) toets. Hierbij moet de -verdeling worden gebruikt omdat alleen de steekproefstandaardafwijking bekend is. Bepaal het kritieke gebied van de toets bij een significantieniveau van %.
Toets : tegen : .
Gebruik een -verdeling met .
De significantie is .
De betrouwbaarheid is %.
geeft bij de waarde .
geeft dus .
Dus , zodat . En , zodat .
Het kritieke gebied is . (Denk om afrondingen!)
De fabrikant krijgt het vermoeden dat hij wel met een lager vulvolume toekan en laat zijn vulmachines instellen op een gemiddelde van . Er mag echter vrijwel nooit te weinig cola in zijn flessen zitten. Hij doet daarom een enkelzijdige toets van : mL tegen : mL.
In een steekproef van flessen vindt hij een gemiddelde met een standaarddeviatie van .
De fabrikant hanteert een significantieniveau van %.
Welke conclusie trekt hij?
Toets : tegen : .
Gebruik een -verdeling met .
De significantie is .
De betrouwbaarheid is %.
en geeft .
(Denk er om dat de tabel alleen positieve -waarden geeft omdat het kritieke gebied rechts van de grens ligt. In dit geval moet het echter links van de grenswaarde liggen, dus wordt negatief.)
Dus , zodat .
Het kritieke gebied is en het gevonden gemiddeld ligt daar niet in.
Hij concludeert dus dat zijn machine juist is afgesteld.
De grootte van de steekproef heeft ook gevolgen voor het weergeven van een betrouwbaarheidsinterval voor het gemiddelde. Bij kleine en onbekende populatiestandaarddeviatie moet je daar ook de -verdeling gebruiken in plaats van de -verdeling.
Een fabrikant van colaflessen met een inhoud van L wil weten op welk gemiddelde vulvolume zijn machine staat afgesteld. Hij doet daarom een steekproef van flessen en vindt een gemiddelde vulvolume mL met een standaardafwijking van mL.
Met welk % betrouwbaarheidsinterval kan hij het juiste populatiegemiddelde vaststellen?
Je gebruikt bij dit kleine aantal en alleen de steekproefstandaarddeviatie de -verdeling.
Bij een % betrouwbaarheidsinterval hoort (dubbelzijdige -tabel met ) .
Het % betrouwbaarheidsinterval ligt tussen en .
Het % betrouwbaarheidsinterval is , dus .
Vergelijk het bij a gevonden betrouwbaarheidsinterval met een betrouwbaarheidsinterval dat je zou vinden door de -verdeling te gebruiken en (onterecht) aan te nemen dat .
Bij een % betrouwbaarheidsinterval horen de -waarden .
Het % betrouwbaarheidsinterval ligt tussen en .
Het % betrouwbaarheidsinterval is , dus .
Leg uit, waarom voor grote waarden van er weinig verschil is tussen een betrouwbaarheidsinterval berekend met de -verdeling en een betrouwbaarheidsinterval berekend met de -verdeling.
Als erg groot is, dan verschillen en maar weinig van elkaar omdat dan en dichter bij elkaar zullen liggen, maar ook omdat je deelt door een groot getal.
Stel is normaal verdeeld met gemiddelde en standaardafwijking .
Iemand vertrouwt het gemiddelde niet en vermoedt (bijvoorbeeld) dat het niet gelijk is aan .
Je toetst : tegen : met een bepaald significantieniveau , dus met een betrouwbaarheid van %.
Dit wordt getoetst met een steekproef van grootte . Er zijn dan twee mogelijkheden:
De populatiestandaarddeviatie is bekend.
Gebruik hierbij de standaardnormale -verdeling
en de Standaardnormale tabel.
De populatiestandaarddeviatie is niet bekend.
Gebruik dan
met de steekproefstandaarddeviatie en
Hierbij hoort deze Student-t-tabel.
Ook bij het bepalen van betrouwbaarheidsintervallen heb je deze twee mogelijkheden:
De populatiestandaarddeviatie is bekend.
Het betrouwbaarheidsinterval is .
De populatiestandaarddeviatie is niet bekend.
Het betrouwbaarheidsinterval is .
De fabrikant wil dat het gewicht (in gram) van zijn pakken suiker normaal is verdeeld met .
De fabrikant test zijn vulmachine door middel van een aselecte steekproef. Hij doet uiteraard een dubbelzijdige toets.
In een steekproef van pakken is het gemiddelde gewicht gram met een standaardafwijking van gram.
Is de bewering van de fabrikant bij een significantieniveau van % terecht?
De hypothesetoets ziet er zo uit:
: .
: .
Omdat de populatiestandaardafwijking onbekend is, hoort hierbij een -verdeling met en .
Het significantieniveau is .
Uit de Student-t-tabel lees je af .
geeft
.
geeft
.
Het kritieke gebied wordt daarom:
.
Het in de steekproef gevonden gemiddelde ligt in het kritieke gebied, dus de fabrikant moet concluderen dat zijn vulmachine beter moet worden afgesteld.
Je ziet in
Voer de beschreven toets zelf uit, laat duidelijk zien hoe je aan de twee grenswaarden komt.
Het gaat om een dubbelzijdige -toets.
Bij en een betrouwbaarheid van % vind je , maar vanwege de dubbelzijdigheid ook .
als , dus
.
als , dus
.
Voer de toets nog eens uit, maar nu met een betrouwbaarheid van %. Is er nog steeds sprake van een significante afwijking?
Nu vind je .
geeft .
geeft .
Er is nog steeds een significante afwijking.
Bekijk
Ook de Consumentenbond test de pakken suiker.
Zij toetsen met een steekproef van pakken of het gemiddelde vulgewicht niet lager is dan g.
Hoe ziet hun hypothesetoets er uit?
: .
: .
In die steekproef is het gemiddelde met een standaardafwijking van gram.
Stel met een betrouwbaarheid van % vast of de Consumentenbond mag zeggen dat de pakken gemiddeld minder dan gram bevatten.
In de steekproef is g en .
Met Student's -verdeling vind je bij en enkelzijdig % dat .
De tabel is echter rechtszijdig en de toets is linkszijdig, dus moet je dit lezen als .
geeft .
Het kritieke gebied is daarom .
De Consumentenbond mag niet zeggen dat de pakken gemiddeld minder dan gram wegen.
Een fabrikant controleert het gewicht (in gram) van zijn pakken suiker.
Hij weegt een steekproef van pakken en ziet dat hun gemiddelde gewicht g is met standaardafwijking g.
Tussen welke grenzen ligt het vulgewicht van al zijn pakken suiker met een betrouwbaarheid van %?
Omdat alleen de steekproefstandaardafwijking bekend is, gebruik je de -verdeling met .
Bij een (dubbelzijdige) betrouwbaarheid van % hoort , gebruik de Student-t-tabel.
Het % betrouwbaarheidsinterval is dus
.
Het gemiddelde gewicht ligt tussen en gram.
In
Bepaal zelf het %-betrouwbaarheidsinterval.
Gebruik weer de -verdeling met maar nu met een (dubbelzijdige) betrouwbaarheid van %. Je vindt dan .
Het %-betrouwbaarheidsinterval is .
Dus .
Bepaal het %-betrouwbaarheidsinterval ook met de -verdeling waarbij je aanneemt g. Vind je een groot verschil?
Dus .
Het verschil is niet erg groot.
Een firma die batterijen levert voor rekenmachines, beweert dat die batterijtjes geschikt zijn om gemiddeld zo’n apparaat uur te laten werken.
In een aselect gekozen groep van rekenmachines stop je de batterijen van deze firma. De gemiddelde levensduur blijkt uur te zijn met een standaardafwijking van uur.
Kun je op grond van dit resultaat met een betrouwbaarheid van % de bewering van de firma verwerpen?
Je toetst tegen met .
(Je zou ook een dubbelzijdige toets kunnen doen, maar op grond van het steekproefresultaat ligt een enkelzijdige toets meer voor de hand.)
In de steekproef is en , dus . Je doet een -toets.
geeft met en een enkelzijdige betrouwbaarheid van % de waarde .
Dus en .
Het kritieke gebied is daarom uur.
De gevonden ligt niet in het kritieke gebied en dus kun je niet met een betrouwbaarheid van % de bewering van de firma verwerpen.
Volgens een wetenschappelijk tijdschrift is het gewicht van zeventienjarigen normaal verdeeld met een gemiddelde van kg en een standaarddeviatie van kg. Om dit gemiddelde te toetsen wordt van aselect gekozen zeventienjarigen het gewicht bepaald. Het gemiddelde gewicht in de steekproef is kg met een standaarddeviatie van kg.
Waarom moet je hier met een -verdeling werken?
De bewering die het tijdschrift doet over de standaarddeviatie wordt niet getoetst, maar je kunt niet zomaar aannemen dat zijn weten dat de populatiestandaardafwijking van de gewichten van zeventienjarigen kg is. Je gebruikt dus de standaarddeviatie die je zelf hebt gemeten.
Bevestigt het onderzoek de bewering van het tijdschrift met een significantieniveau van %?
Doe een dubbelzijdige -toets met en een betrouwbaarheid van %.
Je vindt .
De grenswaarden vind je zo:
geeft .
geeft .
De gevonden waarde kg ligt niet in het kritieken gebied.
De bewering van het tijdschrift blijft overeind.
Vacuüm verpakte vleeswaren mogen maximaal % natriumnitriet bevatten. Bij de keuringsdienst van waren controleren ze dit percentage. Hier vind je de meetgegevens.
Bereken gemiddelde en standaardafwijking van deze gegevens.
en .
Je toetst tegen . Bepaal het bijbehorende kritieke gebied als het significantieniveau is.
Je doet een enkelzijdige -toets met en een betrouwbaarheid van %.
Je vindt , dus voor de ondergrens van het kritieke gebied geldt: .
Dit betekent dat , dus het kritieke gebied is .
Welke conclusie trek je uit deze metingen?
Het gemiddelde niveau aan natriumnitriet is niet te hoog.
In een medisch laboratorium worden voortdurend cholesterolgehaltes in bloedmonsters bepaald. De gebruikte apparatuur wordt elk uur gecontroleerd met
behulp van een ijkmonster. Hiervan is bekend dat het gemiddelde mg per mL zou moeten zijn.
De controlemetingen aan het ijkmonster leveren op: , , , , , , , .
Waarom kun je in deze situatie geen -toets toepassen?
Waarom ligt het niet voor de hand om de standaardafwijking van de steekproef als standaardafwijking voor alle metingen te nemen?
Je kunt geen -toets toepassen omdat de standaardafwijking van de populatie van alle metingen onbekend is.
De steekproef is zo klein dat de standaardafwijking daarvan beslist niet overeen zal komen met de standaardafwijking van de populatie.
Is er met een significantie van reden om aan te nemen dat de meetapparatuur niet goed meer werkt?
Je toetst tegen met .
Nu is en . Je gebruikt een dubbelzijdige -toets met en een betrouwbaarheid van %. Je vindt: .
geeft .
geeft .
De gevonden ligt niet in het kritieke gebied en dus is de afwijking niet statistisch significant.
Een vulmachine vult flesjes water. Een aselecte steekproef van flesjes geeft een gemiddelde inhoud van cL. De standaardafwijking is .
Bereken het % betrouwbaarheidsinterval voor het populatiegemiddelde .
Omdat alleen de steekproefstandaardafwijking bekend is, gebruik je de -verdeling met .
Bij een (dubbelzijdige) betrouwbaarheid van % hoort .
Het % betrouwbaarheidsinterval is dus .
Dit levert op: gram.
Laat zien dat je schatting van beter wordt als je een grotere steekproef neemt.
Neem een steekproefgrootte van .
Het % betrouwbaarheidsinterval is dan .
Als groter wordt, wordt juist kleiner en komen de grenzen dichter bij elkaar te liggen.
In een melkfabriek worden flessen machinaal gevuld. De gedoseerde hoeveelheid per fles is normaal verdeeld. Bij juiste instelling is de verwachte hoeveelheid g per fles. Een kwaliteitsinspecteur neemt een steekproef van flessen en vindt voor het gemiddelde g met een standaardafwijking van g.
Toets, met significantieniveau , g tegen g.
Het gevonden gemiddelde ligt in het kritieke gebied , dus de nulhypothese wordt verworpen.
Omdat alleen de steekproefstandaardafwijking bekend is bij een kleine steekproef, gebruik je de tweezijdige -verdeling met en een betrouwbaarheid van %. Je vindt: .
geeft .
geeft .
Het gevonden gemiddelde ligt in het kritieke gebied
,
dus de nulhypothese wordt verworpen.
Een partij kobaltchloride wordt bij levering door de ontvanger gekeurd op het gehalte kobalt. Hieronder zie je de resultaten van de metingen.
16,2 | 15,8 | 16,1 | 15,8 | 15,9 |
15,9 | 16,2 | 16,1 | 16,2 | 16,0 |
15,8 | 15,9 | 16,1 | 15,8 | 16,0 |
16,0 | 16,0 | 15,9 | 16,2 | 16,2 |
16,0 | 16,1 | 16,0 | 15,9 | 16,3 |
Geef een % betrouwbaarheidsinterval voor het gemiddelde kobaltgehalte .
Het % betrouwbaarheidsinterval wordt .
Steekproef: en .
Bij een betrouwbaarheid van % en vind je .
Het % betrouwbaarheidsinterval wordt dus
.
Ofwel: .
Bij het toetsen van hypothesen met de normale verdeling gebruik je de Standaardnormale tabel.