Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_bootstrapplot.wasp

Title produced by software

Blocked Bootstrap Plot - Central Tendency

Date of computation

Mon, 03 Nov 2008 03:27:00 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225708110uq4w3jrdo2vfgw2.htm/, Retrieved Sun, 19 May 2024 11:37:41 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=20794, Retrieved Sun, 19 May 2024 11:37:41 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

189

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Blocked Bootstrap Plot - Central Tendency] [workshop 3] [2007-10-26 12:36:24] [e9ffc5de6f8a7be62f22b142b5b6b1a8]
F    D    [Blocked Bootstrap Plot - Central Tendency] [Q4 - Blocked Boot...] [2008-11-03 10:27:00] [f1a30f1149cef3ef3ef69d586c6c3c1c] [Current]

Feedback Forum

2008-11-06 13:39:33 [Dana Molenberghs] [reply] 
De betrouwbaarheid van het rekenkundig gemiddelde is veel groter. Het zou een veilige keuze zijn om deze te nemen. De outliers hebben wel effect op het resultaat. Dit zijn outliers van de midrange zelf en niet van de data.
2008-11-08 09:54:08 [Astrid Sniekers] [reply] 
Het antwoord van de student is correct, buiten het feit dat hij of zij zegt dat de outliers geen effect zouden hebben op het resultaat. Als gemiddelde kunnen we het beste de midrange nemen, omdat hier de spreiding/variantie het kleinst is. De midrange is echter zeer gevoelig voor outliers. De outliers wijken ver van het gemiddelde af en zijn zeker relevant! Omdat deze outliers een probleem zijn, zouden we ook kunnen kiezen voor de mean. Hier is de spreiding dan wel groter, maar omdat hier geen outliers zijn, kunnen we zekerder zijn van het gemiddelde (de mean is dus ook bruikbaar in tegenstelling tot wat de student beweert). Meestal wordt het rekenkundig gemiddelde genomen. 
2008-11-09 13:59:01 [2df1bcd103d52957f4a39bd4617794c8] [reply] 
De outliers hebben wel degelijk een invloed op het resultaat! 
 
De midrange vertoont de kleinste spreiding en zou dus de beste benadering kunnen zijn. Hoe groter de spreiding is, hoe groter de variantie. 
 
Toch is het aan te raden in elke verschillende situatie de methodes af te wegen. Outliers die ver afwijken, zoals bij de midrange, kunnen wel degelijk een probleem opleveren.
2008-11-10 13:54:33 [Matthieu Blondeau] [reply] 
De midrange heeft de kleinste spreiding, de waarden liggen dicht op elkaar. Er zijn echter wel veel outliers terug te vinden. 
Men kan hier nog altijd kiezen welke estimator er genomen gaat worden. Ofwel kiest men een brede betrouwbaarheidsinterval met minder kans dat men hierbuiten valt(minder kans op outliers). Ofwel kiest men een kleine betrouwbaarheidsinterval met veel kans om hierbuiten te vallen(veel kans op outliers). Hoe groter de spreiding, hoe onnauwkeuriger het gemiddelde. 
 
De student heeft hier ook de midrange gekozen, wat correct is maar de andere zijn even bruikbaar. De outliers zijn hier wel relevant, dus dit was ook fout van de student.
2008-11-11 09:17:04 [Jens Peeters] [reply] 
De midrange is een goeie calculator omdat de spreiding zeer klein is en dat geeft een nauwkeuriger resultaat. De student merkt op dat de outliers geen effect hebben. Dit is echter verkeerd, dat is net het gevaar als je de midrange gebruikt.
2008-11-11 15:30:34 [Yara Van Overstraeten] [reply] 
De keuze van de midrange als indicator om de geschatte waarde van kledij te bepalen was inderdaad correct omdat de spreiding hier het kleinst is. Maar zoals hierboven al door velen werd bevestigd is het gevaar van de outliers in de midrange, die wel degelijk hun effect hebben op de resultaten. Het is dus misschien beter om de mediaan als indicator te gebruiken omdat hier minder outliers aanwezig zijn die het resultaat kunnen beinvloeden.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20794&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20794&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20794&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'George Udny Yule' @ 72.249.76.132

Estimation Results of Blocked Bootstrap
statistic	Q1	Estimate	Q3	S.D.	IQR
mean	85.4954918032787	86.8934426229508	87.7823770491803	1.66793699274833	2.28688524590164
median	86.4	87.3	88	1.93389854106524	1.59999999999999
midrange	87.85	88.1	88.85	1.08784169303176	1

\begin{tabular}{lllllllll}
\hline
Estimation Results of Blocked Bootstrap \tabularnewline
statistic & Q1 & Estimate & Q3 & S.D. & IQR \tabularnewline
mean & 85.4954918032787 & 86.8934426229508 & 87.7823770491803 & 1.66793699274833 & 2.28688524590164 \tabularnewline
median & 86.4 & 87.3 & 88 & 1.93389854106524 & 1.59999999999999 \tabularnewline
midrange & 87.85 & 88.1 & 88.85 & 1.08784169303176 & 1 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=20794&T=1

[TABLE]
[ROW][C]Estimation Results of Blocked Bootstrap[/C][/ROW]
[ROW][C]statistic[/C][C]Q1[/C][C]Estimate[/C][C]Q3[/C][C]S.D.[/C][C]IQR[/C][/ROW]
[ROW][C]mean[/C][C]85.4954918032787[/C][C]86.8934426229508[/C][C]87.7823770491803[/C][C]1.66793699274833[/C][C]2.28688524590164[/C][/ROW]
[ROW][C]median[/C][C]86.4[/C][C]87.3[/C][C]88[/C][C]1.93389854106524[/C][C]1.59999999999999[/C][/ROW]
[ROW][C]midrange[/C][C]87.85[/C][C]88.1[/C][C]88.85[/C][C]1.08784169303176[/C][C]1[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=20794&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=20794&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Estimation Results of Blocked Bootstrap
statistic	Q1	Estimate	Q3	S.D.	IQR
mean	85.4954918032787	86.8934426229508	87.7823770491803	1.66793699274833	2.28688524590164
median	86.4	87.3	88	1.93389854106524	1.59999999999999
midrange	87.85	88.1	88.85	1.08784169303176	1

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 500 ; par2 = 12 ;

Parameters (R input):

par1 = 500 ; par2 = 12 ; par3 = ; par4 = ; par5 = ; par6 = ; par7 = ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1 < 10) par1 = 10
if (par1 > 5000) par1 = 5000
if (par2 < 3) par2 = 3
if (par2 > length(x)) par2 = length(x)
library(lattice)
library(boot)
boot.stat <- function(s)
{
s.mean <- mean(s)
s.median <- median(s)
s.midrange <- (max(s) + min(s)) / 2
c(s.mean, s.median, s.midrange)
}
(r <- tsboot(x, boot.stat, R=par1, l=12, sim='fixed'))
bitmap(file='plot1.png')
plot(r$t[,1],type='p',ylab='simulated values',main='Simulation of Mean')
grid()
dev.off()
bitmap(file='plot2.png')
plot(r$t[,2],type='p',ylab='simulated values',main='Simulation of Median')
grid()
dev.off()
bitmap(file='plot3.png')
plot(r$t[,3],type='p',ylab='simulated values',main='Simulation of Midrange')
grid()
dev.off()
bitmap(file='plot4.png')
densityplot(~r$t[,1],col='black',main='Density Plot',xlab='mean')
dev.off()
bitmap(file='plot5.png')
densityplot(~r$t[,2],col='black',main='Density Plot',xlab='median')
dev.off()
bitmap(file='plot6.png')
densityplot(~r$t[,3],col='black',main='Density Plot',xlab='midrange')
dev.off()
z <- data.frame(cbind(r$t[,1],r$t[,2],r$t[,3]))
colnames(z) <- list('mean','median','midrange')
bitmap(file='plot7.png')
boxplot(z,notch=TRUE,ylab='simulated values',main='Bootstrap Simulation - Central Tendency')
grid()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Estimation Results of Blocked Bootstrap',6,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'statistic',header=TRUE)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,'Estimate',header=TRUE)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,'S.D.',header=TRUE)
a<-table.element(a,'IQR',header=TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
q1 <- quantile(r$t[,1],0.25)[[1]]
q3 <- quantile(r$t[,1],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[1])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,1])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
q1 <- quantile(r$t[,2],0.25)[[1]]
q3 <- quantile(r$t[,2],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[2])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,2])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'midrange',header=TRUE)
q1 <- quantile(r$t[,3],0.25)[[1]]
q3 <- quantile(r$t[,3],0.75)[[1]]
a<-table.element(a,q1)
a<-table.element(a,r$t0[3])
a<-table.element(a,q3)
a<-table.element(a,sqrt(var(r$t[,3])))
a<-table.element(a,q3-q1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code