Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationFri, 24 Oct 2008 07:28:38 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/24/t12248550193xhbug1ab57ksyo.htm/, Retrieved Tue, 28 May 2024 17:33:43 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18605, Retrieved Tue, 28 May 2024 17:33:43 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact197
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Clothing Producti...] [2008-10-24 13:28:38] [de3f0516a1536f7c4a656924d8bc8d07] [Current]
F   PD      [Univariate Explorative Data Analysis] [Validity of Bouwv...] [2008-10-24 15:03:15] [1376d48f59a7212e8dd85a587491a69b]
-   P         [Univariate Explorative Data Analysis] [Q7 - aanpassing lags] [2008-11-02 16:06:18] [299afd6311e4c20059ea2f05c8dd029d]
-   PD      [Univariate Explorative Data Analysis] [Q2] [2008-11-01 14:02:23] [529a65e524c481ca1098665a9566b89f]
-   PD      [Univariate Explorative Data Analysis] [Q2] [2008-11-01 14:06:58] [529a65e524c481ca1098665a9566b89f]
Feedback Forum
2008-10-29 15:50:21 [Nathalie Koulouris] [reply
De student had gebruik moeten maken van de Lag plot om de autocorrelatie terug te vinden.
2008-11-01 14:13:20 [Kim Huysmans] [reply
Als je het aantal lags had ingegeven dan had je de 2 laatste grafieken ook kunnen zien en aflezen.
Hier heb ik het aantal lags op 12 gezet:
http://www.freestatistics.org/blog/date/2008/Nov/01/t1225548185grccymt626zm674.htm
En hier heb ik het aantal lags op 36 gezet (maximum):
http://www.freestatistics.org/blog/date/2008/Nov/01/t1225548477qe6g7xsrj7e3rif.htm
2008-11-01 14:34:31 [Kristof Augustyns] [reply
In de berekening is een fout gedaan:
https://automated.biganalytics.eu/rwasp_edauni.wasp?parent=t12248550193xhbug1ab57ksyo#output
--> De lags moeten aangepast worden naar 12 (maanden) of 36 (maanden).
Voor de rest is de berekening correct.
Ook geen gebruik van auto correlatie.
Assumption 1: Student is correct door te zeggen dat er een neerwaarts patroon is tot '30' en dat er vanaf dan geen uitschieters zijn.
Assumption 2: De spreiding is hier inderdaad perfect en staan allemaal vrij dicht tegen de lijn (bijna perfect verdeling) en dit ondanks het feit dat we geen autocorrelatie hebben.
Assumption 3: Het is inderdaad een feit dat de uiteinden niet direct constant zijn (normal qq-plot), maar al bij al is het geheel wel vrij constant.
Op de 'run sequence plot' zie je dat er eerst een achteruitgang is, maar die is zeker niet constant.
Het is niet omdat het gemiddelde ronde de 87 schommelt, dat er geen achteruitgang is.
Assumption 4: Men kan het wel afleiden.
Er is sprijding over de tijd heen, sprijding 1ste deel is > sprijding 2de deel.
2008-11-01 20:39:31 [Steffi Van Isveldt] [reply
Wanneer je het aantal lag plots op 36 zet, kan je op de grafiek Autocorrelation Function duidelijk een positieve seizonale autocorrelatie opmerken. (Beter dan wanneer je slechts 12 lag plots hebt) De tijdreeks is dus niet random.
Zie link: http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/01/t12255515665j9whbwaj66jspq.htm
2008-11-02 14:18:55 [Steven Hulsmans] [reply
De lags werden verkeerd ingesteld. Hierdoor worden de laatste grafieken niet weergegeven, en kan assumptie 1 niet worden afgelezen.
2008-11-03 10:40:12 [Karen Van den Broeck] [reply
Assumptie 1: Dit is verkeerd. De student van vorig jaar heeft het verkeerd gedaan. Je moet het lag-plot gaan bekijken. De autocorrelaties moeten heel dicht bij nul liggen. We kunnen dus geen uitspraak doen over volgende maand.
Wanneer je het aantal lag plots op 36 zet, kan je op de grafiek een positieve seizonale autocorrelatie opmerken.
Dan kan ik wel uitspraak doen over de toekomst want het zijn altijd dezelfde maanden.
Conclusie hier is: Tijdreeks is niet random want bevat wel degelijk autocorrelatie maar het is speciale autocorrelatie namelijk seizonale autocorrelatie.
2008-11-03 10:51:04 [Karen Van den Broeck] [reply
Assumptie 2: Goed opgelost. Voor deze assumptie gaan we het histogram en density plot bekijken. Op het histogram zien we min of meer een normaalverdeling en het density plot bult een beetje maar niet erg uitgesproken. Er is hier dus sprake van een normaalverdeling.

Assumptie 3: Om aan deze voorwaarden te voldoen mag de tijdreeks in het run sequence plot niet fluctueren op lange termijn. We zien hier een achteruitgang dus op lange termijn is het niet constant.

Assumptie 4: Je kan er wel een oordeel over vellen. Deze assumptie heeft betrekking op de random component. Heeft die een vaste spreiding? Neen, er zijn een paar outliers die geen effect hebben op het gemiddelde. We moeten kijken naar run sequence plot. Wanneer we de reeks in 2 hakken, zien we dat de spreiding is het eerste deel veel groter is dan in het tweede. Over de tijd heen is er dus een verandering van de spreiding.

Je conclusie is wel goed. Omdat niet aan alle 4 de voorwaarden voldaan is dit inderdaad geen geldig model.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18605&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18605&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18605&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18605&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18605&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18605&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ; par3 = ; par4 = ; par5 = ; par6 = ; par7 = ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')