1 Samenvatting Kennisclips Statistiek I
1.1 Waar zijn we mee bezig?
Binnen de criminologie houden we ons bezig met empirisch onderzoek. Dit vak houden we ons bezig met het onderdeel ‘gegevens verzamelen en analyses doen’.
Data
- Er zijn twee mogelijkheden om data te analyseren:
• Beschrijvende (descriptieve) statistiek: overzichtelijk weergeven van
gegevens
• Inductieve (beslissende) statistiek: conclusies trekken uit gegevens
- Data bestaat uit elementen (personen, landen) en variabelen (kenmerken waarin
binnen de populatie verschil is)
- Er zijn 4 soorten variabelen:
• Kwalitatief:
• Nominaal = geen volgorde tussen de waarden. Bij maar twee categorieën wordt dit ook wel dichotoom genoemd. bv. sekse • Ordinaal = natuurlijk ordening, bv. tevredenheid, schoolcijfer
• Kwantitatief:
3) Interval = continu, geen nulpunt en mogelijk ook negatief, bv. temperatuur 4) Ratio = discreet, natuurlijke nulpunt aanwezig, bv. aantal daders, %
- Missing waardes zijn elementen waarvan we geen data hebben, maar wel coderen!
- Binnen dit vak wordt gebruik gemaakt van SPSS (data matrix). In de rijen staan de
elementen en in kolommen de variabelen.
1.2 Variabelen in beeld
Experimenteel onderzoek
- Hierbij wordt gekeken naar twee of meer groepen die verschillend worden behandeld.
- In deze vorm van onderzoek wordt gebruikt gemaakt van afhankelijke en onafhankelijke
De uitkomsten van beide groepen worden vergeleken om hieruit conclusies te trekken.
variabelen:
• Afhankelijke variabele is de variabele waarover je een voorspelling doet of de uitkomst van je meting. Deze ga je daadwerkelijk meten.Stellen van een vraag Opstellen hypothese Bepalen hoeje gaat onderzoeken of dat klopt Gegevens verzamelen en analysesdoen Resultaten verklarenen conclusietrekken 1 / 4
2 • Onafhankelijke variabele is de variabele waarvan je gaat meten of deze een verandering veroorzaakt bij de afhankelijke variabele.
Exploratieve data-analyse
- Hierin worden grafieken en numerieke samenvattingen gebruikt om de variabelen te
- Het is hierbij belangrijk om de juiste grafiek te kiezen!
beschrijven in een gegevensverzameling en de relaties tussen de variabelen.
Kwalitatief
- Taartdiagram: vergelijking van een categorie met het geheel
- Staafdiagram: verhouding tussen verschillende categorieën
Kwantitatief
- Histogram: aaneengesloten staafdiagram.
- Stamdiagram: bestaat uit stam en blad. In de stam staan de tientallen. Cijfers in het blad
staan op numerieke volgorde.
- / 4
3 Cumulatieve frequentiepolygoon Hierin kunnen de percentages van de populatie of steekproef worden bekeken.
Tijdsgrafiek Deze zijn voor het weergeven van trends of veranderingen over een bepaalde tijd.
1.3 Verdelingen – centrum en spreiding
Verdelingen beschrijven
Je kan de vorm van een verdeling beschrijven op een aantal manieren:
Normaal (symmetrisch), rechtsscheef of linksscheef Uni-, bi- of multimodaal (aantal pieken) Uitschieters zijn waarnemingen die buiten het globale patroon vallen.
Rechts/linksscheef: de kant waar de verdeling een langere/zwaardere staart heeft.
- / 4
4 Centrummaten Modus (score met de hoogste frequentie) Mediaan (middelste score). Deze is ongevoelig voor uitschieters of scheve verdelingen (resistent) Gemiddelde. Wel gevoelig voor uitschieters of scheve verdelingen (niet resistent)
Mediaan en percentielen
- Mediaan (50
- 25
- 75
e percentiel, Q2)
e kwartiel (Q1, middelste eerste helft)
e kwartiel (Q3, middelste tweede helft)
Hierbij zijn er vaak klassen (intervallen) gemaakt voor alle scores. Neem bijvoorbeeld een score van 18 jaar die in het interval 16-19 jaar valt.
ll (lower limit) = exacte ondergrens van het interval (15,5 bij score 18 in interval 16-19) n = totaal aantal scores p = proportie van het gewenste percentiel (bv. 0,25 bij Q1) cf = cumulatieve frequentie van het aantal mensen dat onder het interval van de score zit (dus <16 bij een score van 18 die in het interval 16-19 valt) fi = frequentie van het aantal scores binnen het interval (aantal scores binnen 16-19) w = width = breedte van het interval (1 bij 18-jarigen, 4 bij 16-19 jaar)
Bij de berekening van percentielen ronden we altijd naar beneden af.
Boxplot Hiermee kan je de vijg-getallen-samenvatting in beeld brengen (min, Q1, mediaan, Q3, max) en wordt de spreiding van een variabele in beeld gebracht.
Interkwartielafstand
- IKA = Q3 – Q1
- Dit is een criterium om bepalen of iets een uitschieter is:
- / 4