Basiskennis Meetniveaus variabelen Categorische/kwalitatieve variabelen oNominaal Geen volgorde Geen meeteenheid Geen natuurlijk nulpunt Sekse oOrdinaal Wel volgorde Geen meeteenheid Geen natuurlijk nulpunt SES (Hoog, Gemiddeld, Laag) Kwantitatieve variabelen
oInterval: deling geeft geen juiste uitkomst.
Wel volgorde Wel meeteenheid Geen natuurlijk nulpunt (Nulpunt is arbitrair.) Temperatuur, IQ (Iemand met een IQ van 100 is niet twee keer zo slim als iemand met een IQ van 50.), toets cijfer (Nulpunt is hier arbitrair).oRatio Wel volgorde Wel meeteenheid Wel natuurlijk nulpunt (Nulpunt is niet arbitrair.) Frequentieverdeling
Unimodaal: verdeling heeft 1 piek.
Bimodaal: verdeling heeft 2 pieken.
Gemiddelde: beïnvloedt door outliers.
Mediaan: middelste getal, niet beïnvloedt door outliers.
Modus: getal dat het meeste voorkomt, niet beïnvloedt door outliers.
Variantie 1 / 6
Variantie is de mate waarin de waarden onderling verschillen.Xi (score) (gem) x̄ Afwijkingafwijking 2
464 – 6 = -2 4
565 – 6 = -1 1
666 – 6 = 0 0
666 – 6 = 0 0
767 – 6 = 1 1
868 – 6 = 2 4
SOM = 0 SOM = 10
Variantie(s 2 )= somafwijking 2 aantalscores−1 Variantie= 10 6−1 =2 Standaarddeviatie(s)=√Variantie Standarddeviatie=√2 = 1.41 Stappenplan berekenen variantie 1.Bereken het gemiddelde van de scores.
2.Trek het gemiddelde van alle scores af, zo bereken je de afwijking.
3.Zet al deze afwijkingen in het kwadraat.
4.Tel al deze gekwadrateerde afwijkingen bij elkaar op.
5.Deel de som hiervan door het aantal score – 1.
6.Neem hier de wortel van.Notaties Populatie
oGemiddelde: μ
oStandaarddeviatie SD van de populatie σ
oProportie: p
Steekproef:
oGemiddelde: x̄
oStandaard deviatie: SD
oProportie: p̂
Betrouwbaarheidsinterval Stel je hebt een betrouwbaarheidsinterval van 95%. Wanneer je 100 steekproeven uit de populatie trekt en hier de betrouwbaarheidsintervallen van berekend, zullen 95 van deze betrouwbaarheidsintervallen de échte populatiewaarde bevatten en 5 niet. 95% van de betrouwbaarheidsintervallen zullen de populatiewaarde dus bevatten.(Betrouwbaarheidsintervallen zijn altijd tweezijdig.) Als je oneindig keer uit deze populatie een steekproef van … personen zou trekken, zou in 95% van de gevallen “de ware populatiewaarde” in dit betrouwbaarheidsinterval (lopend van … tot …) liggen en in 5% van de gevallen niet.Let op: het is dus niet zo dat je met 95% zekerheid weet dat de echte populatiewaarde in een bepaald interval ligt. 2 / 6
Betrouwbaarheidsinterval populatiegemiddelde:
oμ=x̄±m om= z∗σ √n N berekenen met de margin of error: je kan zo bepalen hoeveel mensen je in de steekproef nodig hebt om een bepaalde mate van nauwkeurigheid te krijgen.on=( zσ m)
2 3 / 6
Proporties Toetsen met proporties doen we altijd met een z-toets, nooit met een t-toets.Toetsen één proportie De sample proportie (p̂) = aantalsuccesgevallen totaalaantaldeelnemers x n Als de sample size (n) groot genoeg is en gekozen met SRS, zal de steekproevenverdeling van p̂ ongeveer normaal verdeeld zijn.Het gemiddelde is dan μ ^p=p De standaarddeviatie is dan σ = √ p(1−p) n .SE van de steekproefverdeling is dan SE ^p =√ ^p(1−^p) n Omdat p een onbekende waarde is wordt deze vervangen door en zo ontstaat een p̂ standaard error.Berekenen betrouwbaarheidsinterval
- =
p̂ x n o^p(schattingproportie)±m om=z∗√ ^p(1−^p) n Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet- successen beide minimaal 10 zijn.Voorbeeld: je berekent de proportie van het aantal mensen dat de bloktoets heeft gehaald. Het aantal mensen dat de bloktoets wel heeft gehaald en het aantal mensen dat de bloktoets niet heeft gehaald moeten beide minimaal 10 zijn.Plus-vier methode Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode worden toegepast. Je mag dan twee successen en twee niet-successen toevoegen.o^p= aantalsuccessen∈desample+2 n+4 oSE ^p =√ p(1−p) n+4 o^p± z∗√ ^p(1−^p) n+4 N berekenen met de margin of error on=¿¿
oP*: een gegokte waarde voor de steekproefproportie omdat nog onbekend
p̂ is omdat we nog geen data hebben verzameld. P* kan bepaald worden op
twee manieren:
Gebruik uit een pilotstudie.p̂ Gebruik p* = 0.5. Dit is het worst-case scenario, de margin of error is dan het grootst. Je weet dan zeker dat je goed zit.
Nadeel: het gebruik van 0.5 kan leiden tot de uitkomst van een veel
grotere n dan dat in werkelijkheid nodig is.Significantie toets 4 / 6