In dit onderwerp is het trekken van conclusies uit metingen in steekproeven aan bod gekomen. Bij het doen van een uitspraak over één statistische variabele gaat het bij de juistheid om een -toets of een -toets en bij de spreiding om een -toets. Bij twee statistische variabelen gaat het om het vinden van een lineair verband tussen beide en het vaststellen van de sterkte van de samenhang.
Je hebt nu alle theorie van
Volgens de informatie op een pakje drinkyoghurt zou dit gemiddeld gram suiker bevatten. Een onderzoeksbureau beweert dat er in werkelijkheid veel meer suiker in de pakjes zit.
De leverancier van de pakjes besluit een steekproef van pakjes te nemen. De pakjes uit de steekproef bevatten gemiddeld gram suiker.
Neem aan dat de hoeveelheid per pakje normaal verdeeld is met een standaardafwijking van gram.
Onderzoek of dit resultaat voldoende aanleiding is om de informatie die op de pakjes staat te verwerpen. Neem een significantieniveau van %.
Toevalsvariabele is de hoeveelheid suiker in een pakje drinkyoghurt.
Hypothesetoets:
:
:
Omdat de populatiestandaarddeviatie is gegeven wordt dit een -toets.
ofwel vrijwel .
Dit is inderdaad aanleiding om en dus ook de informatie op de pakjes te verwerpen.
Op het etiket van een pot jam staat dat het percentage rietsuiker % is. Om dit te controleren wordt het percentage rietsuiker van willekeurige potten jam bepaald en in een tabel gezet.
Je mag aannemen dat het percentage rietsuiker normaal verdeeld is.
Formuleer de hypothesen in deze situatie.
tegen .
Bereken het gemiddelde en de standaardafwijking van het percentage rietsuiker in de steekproef. Rond af op drie decimalen.
en %.
Toets je hypothese met een significantieniveau .
Je moet nu een tweezijdige -toets doen met en betrouwbaarheid %.
geeft als kritiek gebied .
De nulhypothese wordt verworpen omdat in het kritieke gebied ligt.
Artsen schrijven aspirines voor aan hartpatiënten om te voorkomen dat bloedklonters aderen zullen verstoppen. Bij volwassen mannen is onderzocht of het gebruik van aspirines een positieve invloed heeft op klontervorming in het bloed, dat wil zeggen, dat de stollingstijd groter wordt.
De stollingstijd (in minuten) werd gemeten vóórdat de mannen aspirines innamen en drie uur na het innemen van twee aspirines, zie de tabel.

Onderzoek met behulp van een -toets of beide steekproeven even precies zijn met een betrouwbaarheid van %.
Bereken eerst de standaardafwijkingen.
stollingstijd vooraf: .
stollingstijd achteraf: .
Dubbelzijdige -tabel met en een betrouwbaarheid van % geeft tussen en .
, dus deze -waarde ligt niet in het kritieke gebied.
Beide steekproeven zijn even precies.
Onderzoek met behulp van een -toets of de stollingstijd van het bloed significant is toegenomen. Gebruik een betrouwbaarheid van %.
Het zijn gepaarde waarnemingen dus je kunt naar de verschillen tussen de stollingstijden kijken.
Het gemiddelde daarvan is met een standaardafwijking van .
Je toetst : tegen : .
In de -tabel vind je .
, dus het kritieke gebied is .
Omdat zou je dus kunnen concluderen dat er inderdaad een significant verschil is.
Maar de steekproef is zo klein en het gevonden gemiddelde zit zo dicht bij de grens, dat verder onderzoek nodig is!
leeftijd | woordenschat |
4 | |
5 | |
6 | |
7 | |
8 | |
9 | |
10 | |
11 | |
12 |
Bekijk de tabel met de (geschatte) woordenschat die eentalige Nederlandse kinderen hebben.
Wat mag je, op basis van de gegevens uit deze tabel, concluderen omtrent het verband tussen de leeftijd en de woordenschat van een eentalig Nederlands kind? En kun je hiermee bijvoorbeeld voorspellen hoe groot de woordenschat van een volwassene is?
Er bestaat een sterke correlatie tussen leeftijd en woordenschat, zoals te zien is aan het spreidingsdiagram en de correlatiecoëfficiënt van .

Je kunt hier echter nauwelijks voorspellingen mee doen. Veel hangt af van de verder ontwikkeling.
bron: www.cbsdeakker.nl
In 1947 hielden de wiskundigen Freudenthal en Sittig een statistisch onderzoek ten
behoeve van een nieuw maatsysteem voor vrouwenkleding in opdracht van het warenhuis
De Bijenkorf. Zij lieten daarbij een grote verscheidenheid aan lichaamsmaten opmeten
van vrouwen. Zij vonden onder andere een sterke correlatie tussen de taille (de
omtrek van het lichaam gemeten ter hoogte van de navel) en de bovenwijdte (de omtrek
van het lichaam gemeten ter hoogte van de borst). De gevonden correlatiecoëfficiënt
bedroeg ongeveer .
In hun rapport
Welke betekenis heeft deze hoge correlatie tussen en voor een spreidingsdiagram van deze twee variabelen?
Het spreidingsdiagram bestaat uit punten die ongeveer op een rechte lijn liggen.
Stel een vergelijking op van de regressielijn voor .
De richtingscoëfficiënt is
Het begingetal is
Regressielijn:
Geef een statistisch verantwoorde schatting van de bovenwijdte van een vrouw met een taille van cm.
Gebruik de formule van de regressielijn:
cm