Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_meanplot.wasp
Title produced by softwareMean Plot
Date of computationWed, 29 Oct 2008 09:16:12 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225293588hc67ommuc9oguu9.htm/, Retrieved Mon, 13 May 2024 23:09:28 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19885, Retrieved Mon, 13 May 2024 23:09:28 +0000
QR Codes:

Original text written by user:Aantal inschrijvingen x 1000
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact213
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Mean Plot] [workshop 3] [2007-10-26 12:14:28] [e9ffc5de6f8a7be62f22b142b5b6b1a8]
F    D  [Mean Plot] [Herproducering ta...] [2008-10-29 12:00:40] [819b576fab25b35cfda70f80599828ec]
F    D      [Mean Plot] [Mean plot deel 1 ...] [2008-10-29 15:16:12] [e08fee3874f3333d6b7a377a061b860d] [Current]
Feedback Forum
2008-11-08 09:33:58 [Astrid Sniekers] [reply
Het is duidelijk dat het gemiddelde van maand 9 helemaal anders is als het gemiddelde van maand 10, maand 10 als het gemiddelde van maand 11 en maand 11 als het gemiddelde van maand 12. Om te kunnen zeggen of dit al dan niet significant is, moeten we ook naar de Notched Box Plots-grafiek kijken. Hier merken we weer een groot verschil op tussen de box plot van maand 9 en maand 10, maand 10 en maand 11 en maand 11 en maand 12 want de betrouwbaarheidsintervallen overlappen elkaar helemaal niet. We kunnen dus besluiten dat er hier een significant verschil is.

Het besluit van de student aan de hand van de Sequential Blocks-grafiek is juist.

Aan de hand van Notched Box Plots-grafiek kunnen we niet besluiten dat de midrange de kleinste spreiding vertoont en dus de beste ‘estimater’ is. Of we de midrange al dan niet het beste als gemiddelde nemen, moeten we achterhalen door het maken van de Bootstrap Simulation (zie task 1, Q4)
2008-11-10 11:00:28 [Kevin Neelen] [reply
We zien een dalend verloop van de gemiddelden per maand. Van maand 9 naar 10 is er een plotse stijging in het aantal inschrijvingen waarvoor we niet direct een verklaring kunnen geven.
Het notched box plot (periodic subseries) bevestigt de dalende trend, alsmede de opflakkering rond maand 10. De spreiding van de gegevens binnen de boxen wordt vanaf maand 7 kleiner. Dit is ook de eerste maand die onder het gemiddelde valt op de grafiek van de mean plot. Of dit toeval is of niet, is ons onbekend.
De grafiek van sequential blocks laat zien dat de mediaan ongeveer gelijk blijft wanneer je de gehele periode van 5 jaar beschouwt. Van jaar 1 naar 2 is er een lichte stijging, na jaar 2 zien we echter een daling die zich gedurende jaren 3, 4 en 5 herstelt naar ongeveer het oude niveau.
Tot slot zien we dat gemiddelde, mediaan en midrange ongeveer dezelfde waarden hebben. Midrange vertoont echter de kleinste spreiding en is in theorie dus de beste “estimator”.
2008-11-10 17:28:58 [Michael Van Spaandonck] [reply
Ik moet me wederom aansluiten bij Astrid wat betreft het nagaan van significantie, wat ik doorheen mijn document niet gedaan heb.

Ook is me ontgaan dat ik voor het nagaan van een beste estimator een blocked bootstrap moet gebruiken in plaats van de huidige grafiek, zoals Astrid zegt.

Verder een degelijke bespreking van de grafieken, ik heb verder niets aan de tekst in mijn document toe te voegen.
2008-11-10 21:06:11 [Inge Meelberghs] [reply
Op de mean plot kunnen we inderdaad zien dat er zich een dalende trend voordoet van de gemiddelden per maand. Om na te gaan of deze daling al dan niet significant is moeten we naar de de Notched box grafiek kijken. Als we de betrouwbaarheidsintervallen op elkaar zouden projecteren zouden we kunnen zien dat ze niet overeenkomen waardoor we kunnen vaststellen dat het verschil niet te wijten is aan toeval maar dat het een significant verschil is.

Om te weten of we de midrange als beste gemiddelde moeten nemen, moet je niet naar de Notched box plot kijken maar naar de Bootstrap Simulation. Hieruit kan je dan wel zien hoe hoe groot de spreiding van elke notch is en of er al dan niet veel outliers zijn. Aan de hand van deze punten kan je dan uitmaken welk de beste estimator is voor het gemiddelde. Vaak is dit ook een persoonlijke keuze voor wat je belangrijk acht in je voorspellingen.

Post a new message
Dataseries X:
58.972
59.249
63.955
53.785
52.760
44.795
37.348
32.370
32.717
40.974
33.591
21.124
58.608
46.865
51.378
46.235
47.206
45.382
41.227
33.795
31.295
42.625
33.625
21.538
56.421
53.152
53.536
52.408
41.454
38.271
35.306
26.414
31.917
38.030
27.534
18.387
50.556
43.901
48.572
43.899
37.532
40.357
35.489
29.027
34.485
42.598
30.306
26.451
47.460
50.104
61.465
53.726
39.477
43.895
31.481
29.896
33.842
39.120
33.702
25.094




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19885&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19885&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19885&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132



Parameters (Session):
par1 = 12 ;
Parameters (R input):
par1 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
(n <- length(x))
(np <- floor(n / par1))
arr <- array(NA,dim=c(par1,np+1))
ari <- array(0,dim=par1)
j <- 0
for (i in 1:n)
{
j = j + 1
ari[j] = ari[j] + 1
arr[j,ari[j]] <- x[i]
if (j == par1) j = 0
}
ari
arr
arr.mean <- array(NA,dim=par1)
arr.median <- array(NA,dim=par1)
arr.midrange <- array(NA,dim=par1)
for (j in 1:par1)
{
arr.mean[j] <- mean(arr[j,],na.rm=TRUE)
arr.median[j] <- median(arr[j,],na.rm=TRUE)
arr.midrange[j] <- (quantile(arr[j,],0.75,na.rm=TRUE) + quantile(arr[j,],0.25,na.rm=TRUE)) / 2
}
overall.mean <- mean(x)
overall.median <- median(x)
overall.midrange <- (quantile(x,0.75) + quantile(x,0.25)) / 2
bitmap(file='plot1.png')
plot(arr.mean,type='b',ylab='mean',main='Mean Plot',xlab='Periodic Index')
mtext(paste('#blocks = ',np))
abline(overall.mean,0)
dev.off()
bitmap(file='plot2.png')
plot(arr.median,type='b',ylab='median',main='Median Plot',xlab='Periodic Index')
mtext(paste('#blocks = ',np))
abline(overall.median,0)
dev.off()
bitmap(file='plot3.png')
plot(arr.midrange,type='b',ylab='midrange',main='Midrange Plot',xlab='Periodic Index')
mtext(paste('#blocks = ',np))
abline(overall.midrange,0)
dev.off()
bitmap(file='plot4.png')
z <- data.frame(t(arr))
names(z) <- c(1:par1)
(boxplot(z,notch=TRUE,col='grey',xlab='Periodic Index',ylab='Value',main='Notched Box Plots - Periodic Subseries'))
dev.off()
bitmap(file='plot5.png')
z <- data.frame(arr)
names(z) <- c(1:np)
(boxplot(z,notch=TRUE,col='grey',xlab='Block Index',ylab='Value',main='Notched Box Plots - Sequential Blocks'))
dev.off()
bitmap(file='plot6.png')
z <- data.frame(cbind(arr.mean,arr.median,arr.midrange))
names(z) <- list('mean','median','midrange')
(boxplot(z,notch=TRUE,col='grey',ylab='Overall Central Tendency',main='Notched Box Plots'))
dev.off()