Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_meanplot.wasp

Title produced by software

Mean Plot

Date of computation

Mon, 03 Nov 2008 11:30:45 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/03/t12257380467f4idcks0c2a4dp.htm/, Retrieved Sun, 19 May 2024 11:40:09 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=20963, Retrieved Sun, 19 May 2024 11:40:09 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

155

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Mean Plot] [bootstrap simulat...] [2008-11-03 18:30:45] [f63bd6a82dd07502be9c503a5f141c9b] [Current]

Feedback Forum

2008-11-05 19:06:22 [Kevin Truyts] [reply] 
Deze link vinden we ook terug onder Q4 van task 1. Ik veronderstel dat er een verkeerde link werd gecopieerd. 
Toch werd er de juiste grafiek in het document terug gevonden met de passende commentaar.
2008-11-09 16:27:28 [Kim De Vos] [reply] 
Inderdaad, zoals Kevin reeds vermeld heeft, is dit niet de correcte link. 
link:  
http://www.freestatistics.org/blog/date/2008/Nov/03/t12257390934mc1alqwx5vvfut.htm 
Hier bestaat echter geen correct antwoord. 
 
Je kan de midrange nemen, hier is het plot het kleinst. Dat wil zeggen dat de mediaan minder sterk kan flucturen en de betrouwbaarheid dus groot is.  
De midrange heeft wel als nadeel dat er veel outliers aanwezig zijn.  
 
Daarom kan je ook de mean nemen, deze heeft weliswaar de grootste spreiding, maar heeft het ook kleinst risico op outliers. 
 
Tussen de mean en de midrange moet je afwegen wat het beste is afhankelijk van de spreiding en de aanwezige outliers
2008-11-10 13:18:51 [Inge Meelberghs] [reply] 
Zoals eerder vermeld is dit niet de correcte link. 
 
De student maakt een correcte berekening en kiest voor de midrange. Deze zou volgens hem de beste benadering zijn voor de geschatte waarde van de kledingproductie. Dit is correct al kunnen we dit antwoord nog wat nuanceren.  
 
De midrange geeft de beste benadering omdat de spreiding hier het kleinst is. Een nadeel hier is dat er wel wat outliers zijn die we niet als irrelevant mogen beschouwen. Dit is dan weer niet het geval bij het gemiddelde, hier heb je geen outliers maar is de spreiding wel het grootst. Ook is er hier meer variantie dan bij de midrange. Bij het kiezen van de mean of de midrange moet je kijken naar welk van de twee het beste is afhankelijk van de spreiding en de outliers. 
 
Er is dus eigenlijk geen 'correct' antwoord. Het is eerder een persoonlijke keuze voor wat je belangrijk vindt in je voorspellingen.  
 
 
 
2008-11-11 16:37:57 [Liese Tormans] [reply] 
De student heeft een verkeerde link gegeven. De grafiek in de bespreking klopt echter wel ook de conclusie is op de juiste grafiek gebaseerd. 
 
Dit is de juiste link 
http://www.freestatistics.org/blog/date/2008/Nov/03/t1225710745se8txatyktqe4kz.htm 
 
Bij deze grafieken gaat men de dataset nemen en de gemiddeldes berekenen, maar telkens wordt er random 1 observatie weggelaten en de berekening zo een 500 tal keer uitgevoerd. 
 
Zoals de student gezegd heeft is de midrange een goede benadering maar het is niet de enige oplossing. Maar dat de mean een slechte estimator is klopt niet. Hieronder vind je een beetje uitleg over de grafiek. 
 
Bij de mean zien we een mooie random verspreiding rond het gemiddelde 
Bij de median wordt het patroon duidelijker en gaan de berekeningen meer naar een lijn gaan 
Bij de midrange wordt het patroon nog veel duidelijker, de spreiding is hier veel kleiner dan bij de mean en ook kleiner dan bij de median. 
 
We kunnen voor deze vraag dus twee keuze’s gaan maken. 
 
Als we kiezen voor de midrange als beste estimator. Is er maar een kleine spreiding van de observaties zichtbaar zoals de student vermeld heeft. Maar als we dan een observatie nemen die buiten het 95% betrouwbaarheidsinterval ligt, dan valt deze er ook extreem buiten. 
 
Als we kiezen voor de mean, zien we dat er een grotere spreiding van de observaties zichtbaar is, zo heeft men wel meer zekerheid dat als men iets van deze waarde afwijkt, deze waardes toch nog tussen het betrouwbaarheidsinterval liggen. Het is dus mogelijk om dit als estimator te gebruiken. Hier zat de student een beetje op het verkeerde spoor.  
 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20963&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20963&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20963&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 12 ;

Parameters (R input):

par1 = 12 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
(n <- length(x))
(np <- floor(n / par1))
arr <- array(NA,dim=c(par1,np+1))
darr <- array(NA,dim=c(par1,np+1))
ari <- array(0,dim=par1)
dx <- diff(x)
j <- 0
for (i in 1:n)
{
j = j + 1
ari[j] = ari[j] + 1
arr[j,ari[j]] <- x[i]
darr[j,ari[j]] <- dx[i]
if (j == par1) j = 0
}
ari
arr
darr
arr.mean <- array(NA,dim=par1)
arr.median <- array(NA,dim=par1)
arr.midrange <- array(NA,dim=par1)
for (j in 1:par1)
{
arr.mean[j] <- mean(arr[j,],na.rm=TRUE)
arr.median[j] <- median(arr[j,],na.rm=TRUE)
arr.midrange[j] <- (quantile(arr[j,],0.75,na.rm=TRUE) + quantile(arr[j,],0.25,na.rm=TRUE)) / 2
}
overall.mean <- mean(x)
overall.median <- median(x)
overall.midrange <- (quantile(x,0.75) + quantile(x,0.25)) / 2
bitmap(file='plot1.png')
plot(arr.mean,type='b',ylab='mean',main='Mean Plot',xlab='Periodic Index')
mtext(paste('#blocks = ',np))
abline(overall.mean,0)
dev.off()
bitmap(file='plot2.png')
plot(arr.median,type='b',ylab='median',main='Median Plot',xlab='Periodic Index')
mtext(paste('#blocks = ',np))
abline(overall.median,0)
dev.off()
bitmap(file='plot3.png')
plot(arr.midrange,type='b',ylab='midrange',main='Midrange Plot',xlab='Periodic Index')
mtext(paste('#blocks = ',np))
abline(overall.midrange,0)
dev.off()
bitmap(file='plot4.png')
z <- data.frame(t(arr))
names(z) <- c(1:par1)
(boxplot(z,notch=TRUE,col='grey',xlab='Periodic Index',ylab='Value',main='Notched Box Plots - Periodic Subseries'))
dev.off()
bitmap(file='plot4b.png')
z <- data.frame(t(darr))
names(z) <- c(1:par1)
(boxplot(z,notch=TRUE,col='grey',xlab='Periodic Index',ylab='Value',main='Notched Box Plots - Differenced Periodic Subseries'))
dev.off()
bitmap(file='plot5.png')
z <- data.frame(arr)
names(z) <- c(1:np)
(boxplot(z,notch=TRUE,col='grey',xlab='Block Index',ylab='Value',main='Notched Box Plots - Sequential Blocks'))
dev.off()
bitmap(file='plot6.png')
z <- data.frame(cbind(arr.mean,arr.median,arr.midrange))
names(z) <- list('mean','median','midrange')
(boxplot(z,notch=TRUE,col='grey',ylab='Overall Central Tendency',main='Notched Box Plots'))
dev.off()

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code