Tentamen 1 Opgave 1
Vraag (regulier): Internetconnecties
Bandbreedte van Internetconnecties verwijst naar de maximale hoeveelheid gegevens die een verbinding kan verwerken op een bepaald moment. Hoe meer gegevensverkeer op het Internet, des te beperkter de bandbreedte, en des te trager de verbinding. Om deze reden houden netwerkaanbieders de benutting van hun netwerk en het aantal verbindingen met hun servers zorgvuldig in de gaten. Een voorbeeld van deze monitoring is het waargenomen aantal connecties per minuut dat wordt onderhouden door een bepaalde server opgeslagen in R's datasetWWWusage.Dataset WWWusage is een zogenaamd time series object, dat in R beschikbaar wordt gemaakt met functie data(). Informatie over deze tijdreeks kan worden verkregen met functie help(). Nadat het object beschikbaar is gemaakt, wordt het omgezet naar een numerieke vector users_www met functie as.numeric(), en vervolgens naar een dataframe dfUsers met functie data.frame(). Genoemde
instructies zien er in code uit als volgt:
Open een nieuwe R/RStudio-session, en maak dataframe dfUsers zoals geïllustreerd. Gebruik dataframe dfUsers of vector users_www om de onderstaande vragen te beantwoorden; alle antwoorden zijn gebaseerd op het programma R.
Opmerking: hetzelfde gegevensbestand dfUsers is beschikbaar als
WWWusage.csv en WWWusage.rda in de gedeelde folder in de toetsomgeving voor de duur van de toets, voor het geval dat de eerder beschreven functie data() niet de gewenste gegevens beschikbaar maakt.(a) Samenvattingen van statistische gegevens kunnen maatstaven van centrale en niet-centrale tendentie bevatten, evenals spreidingsmaatstaven. Op z'n minst, bevatten deze statistische samenvattingen een maatstaf van locatie en een maatstaf van spreiding. Deze sub-vraag gaat over de berekening van enkele van deze maatstaven.
1 1 / 3
1a Bepaal de mediaan van het aantal Internetconnecties per minuut (users_www; in
- decimalen)
138.5 > median(WWWusage) 138.5 1b Bepaal het bereik van het aantal Internetconnecties per minuut (users_www; in 3 decimalen).
145.0 > max(WWWusage) 228 > min(WWWusage) 83
228-83 = 145.0
1c Aangezien de dynamiek van het aantal Internetconnecties centraal staat in het onderzoek, is het van belang om inzicht te hebben in de groeisnelheid (growth rate) waarmee gebruikers verbinding maken met de server. Bereken de samengestelde gemiddelde groeisnelheid (growth rate) van het aantal connecties over de waarnemingsperiode (in 3 decimalen).
0.009 > begin_value <- WWWusage[1] > end_value <- WWWusage[length(WWWusage)] > n_periods <- length(WWWusage)-1 > (end_value/begin_value)^(1/n_periods)-1
[1] 0.009298426
2 2 / 3
(b) Een ander aspect van het onderzoek is de variatie van het aantal Internetconnecties per minuut (users_www) dat door de server wordt onderhouden gedurende de waarnemingsperiode.1d Bereken de variantie van het aantal Internetconnecties per minuut (users_www; in 3 decimalen).
1599.953
> var(WWWusage)
[1] 1599.953
1e Bepaal het bereik van een 96%-betrouwbaarheidsintervalschatting van de variantie van het aantal verbonden gebruikers per minuut in de populatie (users_www; in 3 decimalen).
972.707
users_www <- as.numeric(WWWusage) > s2 <- var(users_www) > n <- length(users_www) > n
[1] 100
> alpha <- 0.04 > chi2_upper <- qchisq(alpha / 2, df = n - 1) > chi2_lower <- qchisq(1 - alpha / 2, df = n - 1) > ci_lower <- (n - 1) * s2 / chi2_lower > ci_upper <- (n - 1) * s2 / chi2_upper > ci_exact <- (ci_lower + ci_upper) / 2 > list(lower = round(ci_lower, 3), upper = round(ci_upper, 3), exact = round(ci_exact, 3)) $upper
- / 3