Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 12:42:20 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225132977p93ncc3byownx5d.htm/, Retrieved Sun, 19 May 2024 14:10:16 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19391, Retrieved Sun, 19 May 2024 14:10:16 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact151
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Q2 Univariate exp...] [2008-10-27 18:42:20] [db9a5fd0f9c3e1245d8075d8bb09236d] [Current]
F    D      [Univariate Explorative Data Analysis] [Univariate explor...] [2008-10-27 19:13:58] [d134696a922d84037f02d49ded84b0bd]
-    D        [Univariate Explorative Data Analysis] [Univariate explor...] [2008-10-27 19:16:43] [d134696a922d84037f02d49ded84b0bd]
-   PD        [Univariate Explorative Data Analysis] [Q7] [2008-11-03 18:58:29] [d134696a922d84037f02d49ded84b0bd]
Feedback Forum
2008-11-03 18:39:51 [Stijn Van de Velde] [reply
Fout.

Ik bent hier, niet zoals de student van vorig jaar, vergeten om de gewenste lag in te vullen. Hiervoor had ik bijvoorbeeld 12 of 36 (het maximum) kunnen nemen. Ik heb deze berekening opnieuw gemaakt, en als lag 36 genomen.

http://www.freestatistics.org/blog/date/2008/Oct/31/t1225457138bdsczdub7e7sbwh.htm

Vervolgens moeten we de tijdreeks aan 4 voorwaarden onderwerpen om te zien of we kunnen spreken van 'Tijdreeks = constante + random component'.

1ste assumptie: random drawings?
Er zijn maar 2 pieken (naast lag=0) die buiten het 95% betrouwbaarheids interval (de stippellijntjes) liggen. Deze bevinden zich bij lag=12 en lag=24. Als je naar lag=36 kijkt zie je daar ook een piek, al ligt deze wel binnen het 95% interval.
Met andere woorden: de piek herhaald zich elke 12 maanden. Men kan bij deze tijdsreeks dus spreken van seizoenaliteit.

=> de tijdreeks is random.

Als we naar de lagplot grafiek kijken zien we ook een soort 'puntenwolk', dewelke er ook op duid dat de tijdreeks random is.


2de assumptie: fixed distribution?
Hiervoor hebben we 3 mogelijkheden: we kunnen kijken naar het verloop van het histogram, het density plot en het normal Q-Q plot.

Bij deze 3de moeten de punten precies op de rechte liggen om een perfecte normaal verdeling te hebben. Dit is bij deze tijdreeks niet helemaal het geval.
Dit word ook bevestigd door de 2 eerste methoden. Er lijkt, niet zoals de student zegt, een kleine slag aan de linkerkant te zitten.

Al bij al kan men toch spreken van een vrij normale verdeling.


3de assumptie: has the distribution a fixed location
Kijken naar het Run Sequence Plot.
Lijkt de tijdreeks op lange termijn constant te blijven, of is er eerder een stijging/daling merkbaar?
Omdat dit niet altijd even duidelijk is kan men best de central tendency berekenen, en dan kijken naar de trimmed mean.

De trimmed mean lijkt hier constant, wat wil zeggen dat de tijdreeks zelf ook vrij constant is.
link: http://www.freestatistics.org/blog/date/2008/Oct/31/t12254590302bbxtdnhnhsyzak.htm

Aan deze voorwaarde is dus ook voldaan.

Assumtion 4: had the distribution a fixed variation
Run sequence plot:
Kijken naar de grootte van de flucuatie over de Y-as. Deze moet redelijk constant blijven.
Aan deze voorwaarde lijkt niet voldaan. Er zijn korte en grote pieken zichtbaar.


Algemene conclusie: Er is niet aan alle voorwaarden voldaan, dus de tijdreeks voldoet niet aan het model van 'Tijdreeks = constanet + random component'.
2008-11-03 19:17:45 [Ellen Van Ham] [reply
Dit is een voorbeeld voor Q2:
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/24/t1224859099r68cb036iraulgd.htm

assumptie 1: random drawings? (onafhankelijke toevallige trekkingen)
We bekijken dit via autocorrelatie en lag plot, niet via de run sequence plot zoals de student van vorig jaar heeft gedaan. Hierbij kan men besluiten dat de tijdreeks niet random is, ze bevat autocorrelatie (meer bepaald seizonale correlatie). Het aantal lags kan je best op 36 zetten.

assumptie 2: fixed distribution? (vaste verdeling):
We bekijken dit via het histogram en density plot. We kunnen min of meer spreken van een normaalverdeling. Bij de normal Q-Q plot liggen de meeste punten op de lijn. Ondanks dat we toch geen autocorrelatie hebben, kunnen we toch spreken van een normaalverdeling.

assumptie 3: fixed location? (vaste locatie)
We vermoeden dat er een dalende trend is, maar dit is moeilijk te zien. We kunnen dit ook bekijken via central tendency (is het gemiddelde constant?).

assumptie 4: fixed variation (gelijke spreiding).
Dit beoordelen we via de run sequence plot. In het begin schommelt de tijdreeks harder.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19391&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19391&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19391&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19391&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19391&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19391&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ; par3 = ; par4 = ; par5 = ; par6 = ; par7 = ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')