Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationThu, 23 Oct 2008 10:39:26 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224780051f8emlujcam07lrd.htm/, Retrieved Sun, 19 May 2024 14:10:33 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18549, Retrieved Sun, 19 May 2024 14:10:33 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact138
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Univariate Explorative Data Analysis] [investigating dis...] [2008-10-23 16:39:26] [4f54996111e63ee83b19b6a8540c6bad] [Current]
-   PD    [Univariate Explorative Data Analysis] [asses Q2] [2008-11-03 16:08:34] [3d2d096cc21c6f80db3dd7b8e12effce]
-   P       [Univariate Explorative Data Analysis] [asses Q2] [2008-11-03 16:10:13] [3d2d096cc21c6f80db3dd7b8e12effce]
Feedback Forum
2008-10-29 18:31:01 [Romina Machiels] [reply
Er zijn 4 assumpties, dit had de student goed opgemerkt.
Assumptie 1: Deze vraag werd niet goed beantwoord. Of de tijdreeks autocorrelatie vertoond moet je aflezen op de Lag-plot. Deze grafieken komen bij haar echter niet te voorschijn omdat zij bij de berekening niet het aantal lags heeft ingevuld. Hier had 12 of 36 moeten staan.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225300234x8jti5g72uddtjs.htm
De puntenwolk licht dichter bij elkaar, dus er is wel degelijk sprake van correlatie, het is echter wel seizonale correlatie. De tijdreeks is niet random, maar er is wel degelijk sprake van seizonale correlatie.

Assumptie 2: Dit werd ook niet juist beantwoord, ze heeft de grafieken fout beoordeeld. Het is wel juist dat je dit moet aflezen op het histogram en eventueel de density plot. Er is op beide grafieken een klein hobbeltje. Dit is niet groot genoeg om aandacht aan te besteden. De tijdreeks vertoont dus een normale verdeling.

Assumptie 3: Deze vraag werd fout beantwoord, er werd ook naar de foute grafiek gekeken. Je moet kijken naar de run sequency plot, hierop zie je lichte achteruitgang. Iets bijkomend om naar te kijken is central tendency. Hier kan je kijken naar het gemiddelde of deze constant is, dit is hier het geval, het schommelt namelijk rond de 87. De outliërs hebben niet echt invloed.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225300825i0jr3gtw9zfly6o.htm

Assumptie 4: Deze vraag werd fout beantwoord. Je hebt niet de lag-plot nodig, maar wel de run sequency plot. Als je deze grafiek in 2 splitst, zie je dat de spreiding in het 1ste deel groter is dan in het 2de deel.
De vraag heeft ook betrekking op de random component, dus je kan bij het berekenen de R-module veranderen nl. x = -0,86... (het gemiddelde)dus dan trek je de voorspelling af en zie je nog beter dat de spreiding niet dezelfde is.

De assumpties werden niet goed beoordeeld, er werd ook te weinig informatie gegeven waarom ze het zo dacht. De student had de vraag niet echt begrepen.
2008-11-03 16:32:45 [Joren Nuyts] [reply
Q2: Er werd opgemerkt dat er 4 assumpties gecontroleerd moesten worden maar de interpretatie van de gegevens is niet correct

Bij assumptie 1 heb ik een verbeterde link gemaakt zodat de lags van 12 en 36 erin vermeld worden.
lag 12 =>http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225728547xdyin0slsdsqivi.htm

Lag 36: http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t122572864186bty5bx9tvrfx0.htm

Na het bekijken van de grafieken merken we dat de lag plot als grafiek moet gebruikt worden. Er is geen correlatie omdat de puntenwolk niet op de rechte ligt.
Na assumptie 1 kunnen we ervan uitgaan dat de tijdreeks niet random is want het bevat seizonale autocorreltaie.
De student maakt hier een verkeerde interpretatie.

Bij assumptie 2 wordten de gegevens niet juist ge¨nterpreteerd. Bekijken we het normal QQ-plot merken we dat het vrij dicht bij een normaalverdeling ligt.
De student zegt hier dat de schommelingen te groot zijn om op een normaalverdeling te trekken.

Bij assumptie 3 wordt er gekeken naar de verkeerde grafiek. Hier moeten we kijken naar het run sequence plot. Hier kijken we naar de lange termijn en bemerken we een achteruitgang.
Hier merken we dat op lange termijn het niet constant is maar dit is redelijk moeilijk te achterhalen.
We achterhalen dit door het gemiddelde te berekenen met de central tendensy:
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225727379l4wcq5qyq2l3qmj.htm

In assumptie 4 bekijken we de random component. Deze vraag werd fout beantwoord door de student want er wordt hier naar de lag plot gekeken. Hier moeten we kijken naar het run sequence plot. We bestuderen hier de spreding van de reeks over de tijd heen.
Om dit te doen, splitsen we de grafiek in 2 delen en kijken we of de spreiding groter of kleiner is dan in het andere deel. We merken hier op dat in het eerste deel er meer schommeling is dan in het tweede deel.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18549&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18549&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18549&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18549&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18549&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18549&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')