Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationThu, 23 Oct 2008 09:36:44 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224776279tn0588x5jrsi96e.htm/, Retrieved Sun, 19 May 2024 14:36:03 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18542, Retrieved Sun, 19 May 2024 14:36:03 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact149
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD    [Univariate Explorative Data Analysis] [q2 kleding] [2008-10-23 15:36:44] [1aceffc2fa350402d9e8f8edd757a2e8] [Current]
Feedback Forum
2008-10-30 23:19:23 [Kenny Simons] [reply
Hier heeft de student wel enkele foutjes gemaakt.
Bij assumptie 1 heeft de student wel het aantal lags goed ingesteld, maar zegt dan dat er geen autocorrelatie is, enkel bij het eerste en het laatste maar dat je met deze niet rekening moet houden. Bij lag=1 moet je inderdaad geen rekening houden, maar bij de laatste lag (12) moet je wel rekening houden. Om nu te zien of deze correlatie toevallig is, kun je best het aantal lags hoger zetten, namelijk op 36 en dan zal je zien dat bij de waarde 24 de correlatie wederom hoog is. Dit wil zeggen dat er wel degelijk een correlatie is, namelijk een seizoenale. Bij de link hieronder heb ik het aantal lags op 36 gezet.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t1225381046jopsq56a363ocsz.htm

Assumptie 2 heeft de student wel goed opgelost. Als we naar het histogram of naar het density plot zien, merken we dat er een normaal verdeling is. Er is dan wel een kleine bult te zien, maar hier moeten we niet wakker van liggen. Je kan het antwoord op deze assumptie ook afleiden van het normal QQ Plot. Hier zie je namelijk dat bijna al de punten op een rechte liggen, wat wil zeggen dat er een normaal verdeling is.

Bij de derde assumptie is de student weer in de fout gegaan. Voor de derde assumptie moet je zien naar het run sequence plot. Hier zien we dat de reeks vrij snel op en neer gaat, maar je moet zien naar de lange termijntrend of hier het niveau hetzelfde blijft. Dit is hier niet het geval, het niveau gaat lichtjes achteruit.
Dit kunnen we ook zien op een andere manier. Als we de central tendency berekenen voor deze tijdreeks, kunnen we zien dat bij de winsorized mean het gemiddelde ongeveer bij 87 begint en ook bij plus minus 87 eindigt, dit wil zeggen dat outliers geen invloed op het niveau van het gemiddelde hebben.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t1225381872xstjbt9bcth6nen.htm

Bij assumptie 4 moest je opnieuw gebruik maken van het run sequence plot. Als we deze curve in 2 delen splitsen, zal je duidelijk zien dat de spreiding van deze delen niet hetzelfde is. De spreiding is met andere woorden niet constant.
2008-11-03 19:24:24 [An De Koninck] [reply
De student heeft enkele fouten gemaakt:
Assumptie 1: het is goed dat hij het aantal lags heeft ingesteld. Of dit nu 12, 24 of 36 is maakt niet uit. Als je kijkt naar de onderste grafiek, namelijk deze van de autocorrelation function, zie je dat de waarden tussen de 2 horizontale rechten vallen, wat wijst op een autocorrelatie van 0. Enkel op waarde 0 en 12 zijn er uitschieters (verwijzing naar het aantal lags van 12), wat wijst op een seizoensgebonden tijdsreeks.
Assumptie 2: De student zegt dat er geen uitschieters zijn, maar ik vind dat je op de grafieken toch duidelijke outliers kan aflezen. Toch kunnen we nog spreken van een nomrale verdeling, aangezien de punten vrij goed op een rechte getekend zijn.
Er is dus spraken van autocorrelatie 0 en een normaalverdeling. Dit kan, maar niet omgekeerd!
Assumptie 3: Hier is de student in de fout gegaan door naar een verkeerd grafiek te kijken. Voor de fixed location moet je immers kijken naar central tendency. Op lange termijn is het duidelijk dat de grafiek een dalend verloop lat zien.
Assumptie 4: Hier moet je kijken naar de run sequenze plot, zo kan je de spreiding van de reeks over de tijd heen bekijken. Ze verloopt eigenlijk in 2 delen: aan de linkerkant is de spreiding duidelijk groter dan langs rechts. En over de tijd heen zijn er duidelijk schommelingen.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18542&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18542&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18542&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18542&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18542&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18542&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 12 ;
Parameters (R input):
par1 = 0 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')