Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 14:05:15 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225137965b9qu0snh16vslj5.htm/, Retrieved Sun, 19 May 2024 16:10:27 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19547, Retrieved Sun, 19 May 2024 16:10:27 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact151
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD  [Univariate Explorative Data Analysis] [Q2: Investigate t...] [2008-10-27 17:32:09] [1e1d8320a8a1170c475bf6e4ce119de6]
F R PD      [Univariate Explorative Data Analysis] [Q2 investigating ...] [2008-10-27 20:05:15] [02e7fb326979b65614900650d62c19a6] [Current]
F   PD        [Univariate Explorative Data Analysis] [Q2 investigating ...] [2008-10-27 20:43:06] [3754dd41128068acfc463ebbabce5a9c]
Feedback Forum
2008-10-30 10:59:36 [Tamara Witters] [reply
1)De student heeft de verkeerde grafiek gebruikt om te zien of autocorrelatie is. Hij heeft echter wel de juiste conclusie gemaakt dat er geen autocorrelatie is.
2) dit is een foute conclusie. We kunnen bij het histogram de 2e en 3e balk niet beschouwen als echte outliers. Waardoor er bijgevolg wel een normaalverdeling is.
3) De student heeft de verkeerde grafiek gebruikt, bijgevolg ook een verkeerde conclusie.
4)Ook hier heeft de student gebruik gemaakt van de verkeerde grafiek.

De uiteindelijke conclusie is wel juist.

Opmerkingen:

Assumption 1: Are the data autocorrelated? (The model assumes no autocorrelation)

In begin moet je bij de opties het aantal 'lags' opgeven: lags= 12 of 36
(zie blog: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224756407dauau5ixbis6gu1.htm)

* Grafiek lagplot:
We kunnen dit testen door de autocorrelatie of het Lagplot. De correlatie is een maatstaf die aangeeft in welke mate de punten op een rechte ligt.
We kunnen afleiden uit de lag plot dat de autocorrelatie heel dicht bij 0 ligt.
*Grafiek autocorrelation function:
We kunnen ook kijken naar de autocorrelation function , dan kunnen we het aantal lags best wel op 36 zetten.
We zien een eerste grote correlatie bij lag 12, een 2e grote bij lag 24, waardoor we kunnen besluiten dat er seizonale correlatie is. A.d.h hiervan kunnen we ook een voorspelling voor de toekomst maken.
De horizontale stippenlijnen geven de betrouwbaarheidintervallen weer met een waarschijnlijkheid van 95%. We hebben 5% kans dat de autocorrelatie erbuiten valt.
Conclusie: De tijdreeks is niet random en bevat correlatie, nl seizoensgebonden correlatie.

Assumption 2: Is the random component generated by a fixed distribution? (The model assumes a fixed distribution)

Hiervoor moeten we kijken naar het histogram en density plot
Je kan merken dat het verloop een normaalverdeling weergeeft (uitgezonderd aan de linkerkant een uitschieter)
Ook kijken we naar het Q-Q plot
We trekken een denkbeeldige lijn door de punten : liggen de punten op deze denkbeeldige lijn?
De punten liggen toch vrij dicht op de lijn, bijgevolg: normaalverdeling.

Assumption 3: Is the deterministic component constant? (The model assumes that the distribution has a fixed location)
We kijken hierbij naar het “run sequence plot”
Op LT is het niveau van deze reeks niet constant
We moeten ons afvragen of het gemiddelde constant is, bijgevolg kijken we naar de central tendency.
Bij de robustness van central tendency zien we toch dat het verloop vrij constant is.
MAAR op LT vermoeden we een dalende trend.


Assumption 4: does the random component have a fixed variation? (The model assumes a distribution with fixed variation)
Hiervoor gebruiken we ook de run sequence plot
We kijken naar de spreiding van de reeks over de tijd heen. Het linkse gedeeltde van de reeks schommelt harder. Bijgevolg is er een verandering van de spreiding over de jaren heen.


Besluit:
Er is niet aan alle voorwaarden voldoen dus de tijdreeks voldoet niet helemaal aan het model van: Clothing Production = constant + random component
Vermits er seizoensgebonden correlatie is;











2008-11-01 17:23:26 [Natascha Meeus] [reply
assumptie 1:
De student maakt hierbij gebruik van de foute grafiek. We moeten gebruik maken van de lagplot en de partial autocorrelation. Bij de lagplot kunnen we het aantal lags instellen op 12 of 36. De meeste van deze waarden liggen binnen het betrouwbaarheids interval, de enkele die boven het betrouwbaarheidsinterval komen zijn niet representatief omdat hun kans op voorvallen veel kleiner is dan die bij 12. We besluiten bij assumtie 1 dat de tijdreeks niet random is maar correlatie bevat. in dit geval seizoensgebonden correlatie.

assumptie 2: de juiste grafieken werden gebruikt, namelijk het histogram en het density plot. Er is een normale verdeling zichtbaar bij het density plot. De meeste punten liggen dicht bij de rechte, het is wel niet perfect normaal verdeeld. Er is wel een kleine afwijking, maar deze is niet zo belangrijk.

assumptie 3: Hier moest we run sequence plot gebruikt worden of de central tendancy gebruiken. Bij het gebruiken van de central tendancy zien we dat outliers niet veel invloed hebben. Er is een vermoeden van een dalende trend, maar dit is niet zeker.

assumptie 4: hier moest men het run sequence plot gebruiken. Dat is hier niet gebeurd. Voor 30 zien we veel meer schommelingen. De mediaan is ongevoelig voor outliers.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19547&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19547&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19547&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19547&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19547&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19547&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')