Biomedische statistiek SPSS VIDEO’s
Gepaarde data: variabelen horen samen, herhaalde metingen. Vb. BMI
voor & na operatie
Ongepaarde data: variabelen zijn willekeurig. Vb. rokers of niet-rokers
Parametrisch: normaal verdeeld, genoeg # niet-parametrisch: weinig metingen, rare verdeling, altijd nagaan welke van de twee, ook steeds de outliers controleren
Nulhypothese: H0 verwerpen als p < 0,05 of H0 aanvaarden als p > 0,05
Syntax: als je een test meerdere keren moet uitvoeren paste
Nieuwe variabelen (wanneer het over een verschil gaat) transform / compute variable
Outcome variabele: de variabele waarin we geïnteresseerd zijn, hoe deze
verandert afhankelijk van de andere variabelen.Database onderverdelen transform / recode into different variables numeric variable= grote groep & name = nieuwe naam invullen old & new values range, LOWEST ( 0 tot laagste dat je opgeeft) = old & 1 = new range = old & 2 = new
…
range, HIGHEST ( 0 tot hoogste dat je opgeeft) = old & n = new Ongepaarde student t test = Hypothese test die nagaat of er een significant verschil is tussen de gemiddelde van 2 groepen Vb. zijn mannen gemiddeld groter dan vrouwen?
-twee variabelen:
1.1 categorische variabele van 2 niveaus (man of vrouw) 2.1 continue variabele (lengte) -Ongepaarde data -Parametrische test = voordat we deze test mogen uitvoeren in principe moeten nagaan of dat de data bij benadering normaal verdeeld is (voor uitvoeren nakijken voor normale verdeling) -Zoals elke hypothesetest heeft deze test ook een Nulhypothese. Als je de test uitvoert krijg je een p-waarde. Aan de hand van de p waarde kun je beslissen of je de 0 hypothese aanvaardt of verwerpt Bestaan eigenlijk twee varianten Student T-test 1.Gelijke varianties 2.Ongelijke varianties Om te beslissen of je de een of de andere moet gebruiken kun je gebruik van de levenes test for equality of varances. Is een extra test eigenlijk die ook een nul hypothese heeft en dus ook een p waarde zal geven. Aan de hand van de levens test kun je dan besluiten of je dan de ene variant van
1 1 / 4
de student t test moet gebruiken of de andere. Als de p waarde van de levenes test kleiner is dan 0,05, mogen we de nul hypothese verwerpen en gaan we er van uit dat er ongelijke varianties zijn. P waarde groter dan 0,05 mogen wel niet verwerpen, gaan we uit van gelijke varianties.-De outcome van de levens test bepaalt dus welke variant van de student t test we mogen gebruiken.
-Student T test: er is geen verschil tussen de gemiddelden van de beide
groepen
- ! Gelijke en ongelijke variantie ! Levene’s test for equality of variances
(extra test: wordt automatische uitgevoerd door SPSS bij ongepaarde
student t test) H0 : geen verschil tss de varianties:
p < 0,05: ongelijke variantie
p > 0,05: gelijke variantie
bepaald dus naar wat we moeten kijken bij de ongepaarde student t test BOOM 1.Twee variabelen, 1 continue 1 categorisch = ja 2.Heeft de categorische variabele slechts twee niveaus = ja
3.Mogen we parametrisch testen: of de distributies normaal verdeeld
zijn en of er voldoende aantallen zijn = altijd ja 4.Hebben we te maken met gepaarde data = niet waar (anders is het gepaarde student t-test) 5.Volgens boom nagaan of variaties gelijk zijn of niet dit is de levines test en wordt door SPSS automatisch uitgevoerd als je de ongepaarde student t-test gebruikt, output zal zeggen of de varianties gelijk zijn of niet analyze / compare means / independent sample t test -Value is de continue variabele -Group is de categorische variabele is ofwel 1 of 2
2 2 / 4
Als je de test uitvoert altijd eerst nagaan of er outliers zijn en of je parametrisch mag testen of niet (histogrammen maken) analyze / compare means / independent sample t test -In test variables komt de continue variabele = value -Bij grouping variable komt altijd de categorische variabele = Group, eerst ?? want weten tussen welke groepen je gaat kijken Ok, nieuw kader in beeld, Group statistics zegt iets over hoeveel waarnemingen er zijn per groep, gemiddelde waarneming, standaarwaarneming Voor ons interessante is independent sample test, altijd als eerste kijken naar Sig. De waarde zal zeggen of de varianties gelijk zijn of niet. Groter dan 0,05 gaan we uit van gelijke varianties en dan kijken we naar de bovenste rij (equal variances assumed). Kleiner dan 0,05 is onderste rij. Wij kijken nu naar bovenste rij. Dan naar kolom Sig (2-tailed) o,001. Dit is beduidende kleiner dan 0,05 dus nul hypothese mogen we verwerpen, was dat er geen verschil was tussen gemiddelden van beide groepen, maar verwerpen, dus wel verschil normaal verdeeld en aantallen, we krijgen een kader waarin we vanboven de cont var en beneden de cat var. Deze laatste moeten we nog verder bepalen.output = twee kaders, boven = gewone info, onderste = resultaten van de test 2 e kolom= levene p > 0,05 = bovenste rij, p < 0,05 onderste rij bekijken van de gehele kader 5 e kolom = sig (2-tailed) p > 0,05 = niet verwerpen H0 p < 0,05 = verwerpen H0 Gepaarde student t test = Hypothese test die nagaat of het gemiddelde van het verschil van 2 verdelingen gelijk is aan 0 Vb. Is er een verschil tussen het BMI voor en na het volgen van een dieet?
-2 variabelen net als bij de ongepaarde student t-test: 1 categorische
variabele van 2 niveaus (tijd, voor en na dieet) & 1 continue variabele (BMI)
-Nu WEL gepaarde data & Parametrische test:
Om na te gaan of je parametrisch mag testen of niet, moet je bij gepaarde data altijd nagaan of het verschil van beide distributies bij benadering normaal verdeeld is Dit is een groot verschil met de ongepaarde student t-test waarbij je bij elke distributie apart nagaat of het normaal verdeeld is Dus op de verschil verdeling nagaan of het normaal verdeeld is of niet Gepaarde variabelen in SPSS
3 3 / 4
kan alleen maar werken met gegevens zoals in de rechterkolom Rechts lijken op twee continue variabelen
Belangrijk: zie in dat
het zoals links geïnterpreteerd moet worden BOOM 1.Twee variabelen, 1 continue 1 categorisch = ja (als je uitgaat van continue is nee maar dat is dus fout, je moet het goed interpreteren bij gepaarde data) 2.Heeft de categorische variabele slechts twee niveaus = ja
3.Mogen we parametrisch testen: of
de distributies normaal verdeeld zijn en of er voldoende aantallen zijn = ja, want parametrische test 4.Hebben we te maken met gepaarde data = ja als het verschil normaal verdeeld is, dit moet dus eerst berekend worden
gepaarde data in SPSS: Belangrijk voor de 1
ste stap bij de boom van wuyts is op te merken dat je de data ziet als 2 continue variabele maar het wel degelijk gaat over continue en categorische variabelen! analyse / compare means / paired samples t test -Je hebt twee variabelen, upstream en downstream - dit LIJKEN twee continue variablen, het is GEPAARDE DATA (categorisch…) -Normaal gezien, om te weten of je parametrisch mag testen of niet moeten we het verschil berekenen tussen beide. Op deze verschil verdeling zou nagegaan moeten worden of het normaal verdeeld is of niet. (we gaan er nu vanuit dat het in orde is) analyse / compare means / paired samples t test downstream en upstream rechts invullen, in theorie kun je meer pairs invullen voor meer t testen maar is hier niet nodig OK Net als bij ongepaarde t-test krijg je aantal statistieken Tweede kader zegt meer over correlatie
Geintereseerd in paired samples test, belangrijk: significantie 2-
tailed. 0,008 is significant kleiner dan 0,05 dus op basis op van deze test kunnen we besluiten dat er een significant verschil is voor en na (downstream en upstream) we moeten eerst een verschil berekenen en hiervan de normale verdeling en aantallen nagaan, daarna bij de test we krijgen een kader met 3 kolomen in kolom 2 en 3 voegen we het paar variabelen toe. OK (voor de rest hebben we
- / 4