Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 05:10:42 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225105896lpkvtya4dhip5aq.htm/, Retrieved Sun, 19 May 2024 15:55:02 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19227, Retrieved Sun, 19 May 2024 15:55:02 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact142
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Workshop 3 q2] [2008-10-27 11:10:42] [60d772482829eb846b04c71947363055] [Current]
F           [Univariate Explorative Data Analysis] [Q2] [2008-10-27 21:00:15] [299afd6311e4c20059ea2f05c8dd029d]
-   P         [Univariate Explorative Data Analysis] [Q2 lag 12] [2008-11-02 12:45:55] [299afd6311e4c20059ea2f05c8dd029d]
-   P         [Univariate Explorative Data Analysis] [Q2 lag 36] [2008-11-02 12:55:59] [299afd6311e4c20059ea2f05c8dd029d]
-   P       [Univariate Explorative Data Analysis] [Q2 - incl. 36 Lags] [2008-10-29 14:54:18] [6f54f97492451bf8edc5dd186465ee4a]
Feedback Forum
2008-10-29 15:09:46 [Niels Stas] [reply
Het eerste wat me opviel is dat de student geen gebruik gemaakt heeft van 'lags' waardoor ze grafiek 5 (Lagplot, lowess and regression line) & 6 (autocorrelation function) niet te zien kreeg.
Deze kan je krijgen door bij het reproducen 'lags' te wijzigen in 12 of 36. Resultaat: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t12252921252nps3zc82u07r9e.htm

Uit de verkregen grafieken kan je dan afleiden dat er zo goed als geen correlatie bestaat, waardoor een voorspelling moeilijk tot onmogelijk word. Maar, als je kijkt naar de laatste grafiek dan zie je dat er een seizonale autocorrolatie is. Dit is vooral zichtbaar bij de periodes waar de lijn boven de betrouwheidsinterval lijnen uitsteekt (omdat deze frequent om de 12 maanden voorkomt).
2008-11-02 19:22:13 [Stijn Van de Velde] [reply
Dit is helemaal niet juist. Je kan zien of de tijdreeks aan 'Clothing Production = constant + random component' voldoet door deze aan 4 voorwaarden te onderwerpen.

Om te beginnen ben je hier vergeten om de gewenste lag in te vullen. Hiervoor had je bijvoorbeeld 12 of 36 (het maximum) kunnen nemen. Op onderstaande link zie je wat dan het resultaat had geweest, ik heb daarvoor lag 36 genomen.

http://www.freestatistics.org/blog/date/2008/Oct/31/t1225457138bdsczdub7e7sbwh.htm

1ste assumptie: random drawings?
Er zijn maar 2 pieken (naast lag=0) die buiten het 95% betrouwbaarheids interval (de stippellijntjes) liggen. Deze bevinden zich bij lag=12 en lag=24. Als je naar lag=36 kijkt zie je daar ook een piek, al ligt deze wel binnen het 95% interval.
Met andere woorden: de piek herhaald zich elke 12 maanden. Men kan bij deze tijdsreeks dus spreken van seizoenaliteit.

=> de tijdreeks is random.

Als we naar de lagplot grafiek kijken zien we ook een soort 'puntenwolk', dewelke er ook op duid dat de tijdreeks random is.

2de assumptie: fixed distribution?
Hiervoor hebben we 3 mogelijkheden: we kunnen kijken naar het verloop van het histogram, het density plot en het normal Q-Q plot.

Bij deze 3de moeten de punten precies op de rechte liggen om een perfecte normaal verdeling te hebben. Dit is bij deze tijdreeks niet helemaal het geval.
Dit word ook bevestigd door de 2 eerste methoden. Er lijkt, niet zoals de student zegt, een kleine slag aan de linkerkant te zitten.

Al bij al kan men toch spreken van een vrij normale verdeling.

3de assumptie: has the distribution a fixed location
Kijken naar het Run Sequence Plot.
Lijkt de tijdreeks op lange termijn constant te blijven, of is er eerder een stijging/daling merkbaar?
Omdat dit niet altijd even duidelijk is kan men best de central tendency berekenen, en dan kijken naar de trimmed mean.

De trimmed mean lijkt hier constant, wat wil zeggen dat de tijdreeks zelf ook vrij constant is.
link: http://www.freestatistics.org/blog/date/2008/Oct/31/t12254590302bbxtdnhnhsyzak.htm

Assumtion 4: had the distribution a fixed variation
Run sequence plot:
Kijken naar de grootte van de flucuatie over de Y-as. Deze moet redelijk constant blijven.
Aan deze voorwaarde lijkt inderdaad niet voldaan. Er zijn korte en grote pieken.

Algemene conclusie: Er is inderdaad niet aan alle voorwaarden voldaan, dus de tijdreeks voldoet niet aan het model van: Clothing Production = constant + random component.
2008-11-03 09:50:49 [Jens Peeters] [reply
Ik kan mij enkel aansluiten bij de commentaar van stijn.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19227&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19227&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19227&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19227&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19227&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19227&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')