Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationSat, 25 Oct 2008 08:10:42 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/25/t1224943900la1031zy5xdg2zm.htm/, Retrieved Sun, 19 May 2024 12:58:22 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18743, Retrieved Sun, 19 May 2024 12:58:22 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact184
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Univariate Explorative Data Analysis] [Univariate explor...] [2008-10-25 14:10:42] [0831954c833179c36e9320daee0825b5] [Current]
-   PD    [Univariate Explorative Data Analysis] [Q2 - 36 Lags] [2008-10-29 17:07:41] [6f54f97492451bf8edc5dd186465ee4a]
-   PD    [Univariate Explorative Data Analysis] [Q2 - Bob Leysen] [2008-10-30 13:19:12] [57850c80fd59ccfb28f882be994e814e]
-           [Univariate Explorative Data Analysis] [Q2; assumptie 1] [2008-11-03 10:28:04] [8e4e5f204c24e6d05647858dae308d17]
Feedback Forum
2008-10-29 17:13:48 [Niels Stas] [reply
Op het eerste zicht valt op dat bij de blog van de student de laatste 3 grafieken niet weergegeven worden. Dit is te verklaren door dat de student geen gebruik heeft gemaakt van 'Lags'. Deze lags kan je als parameter veranderen naar 36 om zo het meest nauwkeurige resultaat te bekomen. (resultaat: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t12253001010y9xqk4mr4e0ci9.htm)

Van deze grafieken kan je afleiden dat er toch een seizonale autocorrelatie is, waardoor voorspelling mogelijk is. Vooral uit de laatste grafiek is af te leiden dat er steeds een terugkerend patroon is (vooral de 12e maanden) waardoor je kan besluiten dat je voorspellingen kan doen voor dezelfde maand in de toekomst.

Wel is het zichtbaar dat het niveau lichtjes daalt, dus hier zal wel rekening mee moeten gehouden worden bij toekomstige voorspellingen.
2008-10-29 19:17:23 [Tom Ardies] [reply
Zoals de commentaar hierboven zijn de lags niet ingesteld dus zijn er geen grafieken om de willekeurigheid van de data te beoordelen.

Er is wel degelijk een vorm van correlatie als men naar de lags 12 en 24 kijkt: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t12252874301t29xy3nalko90s.htm

De data vertoont een normale verdeling. Dit kan men zien door naar de densityplot te kijken of naar de QQ-plot waarbij de data zich op of zeer nabij de recht ligt.

Voor de derde assumptie moet je naar de tendens van de run sequence plot kijken. Deze vertoont een licht daling op lange termijn.

Voor de laatste assumptie hoef je enkel naar de run sequence plot te kijken om te zien of data een zelfde spreiding heeft over de tijd. Dit is niet het geval, want in het begin is de data verder gespreid, dan naar het einde toe.
2008-10-30 13:37:37 [Bob Leysen] [reply
Ik heb de lags inderdaad niet ingesteld, deze moeten 36 worden. Ik heb dan ook een nieuwe link gemaakt:
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t12253728791frueq4z3rg1624.htm

Als we naar de density plotof de QQ plot kijken is er duidelijk een normaalverdeling. De punten liggen zeer dicht bij de rechte. Enkel in het bein en einde zijn er wat outliers.

De run sequence plot kent een lichte daling, maar je kan ook zien dat er een zekere seasonaliteit is. Dit is belangrijk voor assumptie 3.

In de run sequence plot kan je ook zien of er een geen gelijke spreiding is. . Dus de laatste assmptie is hier niet van toepassing. De spreiding van het eerste deel (tot 30) is kleiner dan de spreding na 30. We hebben tijdens het college ook gezien dat wanneer je een lijn invoegt in de R-code de spreiding kan wijzigen.
2008-11-03 16:32:21 [Jeroen Michel] [reply
Hier zijn de foute conclusies getrokken daar de verschillende lags niet zijn ingesteld geweest.

Het is duidelijk dat aan de vorige feedback weinig valt toe te voegen. Voor deze vraag heb ik dus op aanraden van vorgaande student de herberekingen gemaakt en rekening gehouden met de opmerkingen die zij had/heeft.

Assumptie 1:
Hierbij heb ik deze keer inderdaad gekeken naar de lag plot ipv. de run sequence plot. De resultaten zijn terug te vinden onder deze link:
lag 1: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t12256648775yuu0x8xxg6fgch.htm, Retrieved Sun, 02 Nov 2008 22:28:06 +0000 Tevens houden we rekening met de puntenwolken zoals opgesomd door de vorige studente.

lag 12: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665259gny0zbzwwq6rpqr.htm, Retrieved Sun, 02 Nov 2008 22:34:28 +0000

lag 36: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665398n329mjtqxwani17.htm, Retrieved Sun, 02 Nov 2008 22:36:51 +0000

Assumptie 2:
Hier is inderdaad een foute interpretatie gemaakt. Hier is er inderdaad sprake van een normaalverdeling. Aangezien er in Q1 geen autocorrelatie is, is er hier sprake van normaalverdeling. De resulaten zijn wel op de juiste grafieken afgelezen geweest.

Assumptie 3:
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665670l3jnqcbv4p6c0d6.htm, Retrieved Sun, 02 Nov 2008 22:41:15 +0000
In bovenstaande berekening vind u de juiste oplossingen terug. Hier zijn de opmerkingen van voorgaande studente op waar te nemen en zien we op het einde inderdaad de dalende trend.

Assumptie 4:
Hier is er niet gewerkt door de verschillende lags in te stellen. Belangrijk is hier wel dat deze aanpassingen gebeuren om tot volgende voorwaarde te komen: Clothing Production = constant + random component.

Onderstaande link geeft de de juiste feedback ook weer:
http://www.freestatistics.org/blog/date/2008/Oct/28/t1225153355pgrr9krt7tyyopr.htm

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time22 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 22 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18743&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]22 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18743&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18743&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time22 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18743&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18743&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18743&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')