Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 15:36:23 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225143415cqefm2gnkyp04r5.htm/, Retrieved Tue, 28 May 2024 16:26:32 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19647, Retrieved Tue, 28 May 2024 16:26:32 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact153
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigating dis...] [2007-10-22 19:45:25] [b9964c45117f7aac638ab9056d451faa]
-    D  [Univariate Explorative Data Analysis] [Q7 investigating ...] [2008-10-27 21:34:09] [3754dd41128068acfc463ebbabce5a9c]
F           [Univariate Explorative Data Analysis] [Q7 investigating ...] [2008-10-27 21:36:23] [02e7fb326979b65614900650d62c19a6] [Current]
Feedback Forum
2008-10-30 11:57:22 [Tamara Witters] [reply

Q10: Investigate seasonality in your time series.
Je hebt een juiste oplossing gegeven maar voor echt zeker te zijn, kan je beter in je opties lags= 36 nemen. Ik heb dit even gechecked maar er is geen seizoenalisteit is je datareeks.
2008-10-30 12:00:35 [Tamara Witters] [reply

Q7: Investigate the validity of the model:
Your Time Series = constant + random component
Deze vraag heb je fout opgelost, je hebt dezelfde fouten gemaakt als in task 1.
Ik raad je aan even de opmerkingen na te lezen die ik gemaakt heb in de feedback bij task 1
2008-11-01 17:37:39 [Natascha Meeus] [reply
Deze vraag is hetzelfde als Q2 van task 1. Alleen moet deze met je eigen tijdreeksen gemaakt worden. We merken hier dezelfde fouten op als in Q2. Soms werden er de verkeerde grafieken gebruikt en dus ook de verkeerde conclusies gemaakt.
2008-11-03 11:30:31 [Astrid Sniekers] [reply
De student heeft de oefening niet helemaal correct uitgevoerd, maar hieronder vindt u hoe het wel zou moeten.

Om de validiteit van een model na te gaan moeten de volgende 4 assumptie getest worden.

- Assumptie 1 (are the data autocorrelated? (the model assumes no autocorrelation))

http://www.freestatistics.org/blog/date/2008/Nov/01/t1225547853wu7m5yipsgo86oh.htm
Om autocorrelatie te kunnen aflezen, kijken we niet naar de Run Sequence Plot (eerste grafiek) zoals de student heeft gedaan. Wel kijken we naar de laatste twee grafieken, namelijk: de Lag plot en de Autocorrelation Function.

De rechte lijn in de Lag plot-grafiek heeft een stijgend verloop. De puntenwolk ligt vrij dicht rond de lijn. Dit betekent dat de autocorrelatie redelijk positief is. Als de autocorrelatie nul was, betekent dit dat er geen autocorrelatie is en dat de tijdreeks random zou zijn.

Als we bij het aantal lags (# lags) 36 ingeven, zien we op Autocorrelation Function-grafiek (de laatste grafiek) dat de autocorrelatie sterk positief is!

 De tijdreeks heeft sterke positieve autocorrelatie en is niet random.

- Assumptie 2 (is the random component generated by a fixed distribution? (the model assumes a fixed distribution))

http://www.freestatistics.org/blog/date/2008/Nov/01/t1225547853wu7m5yipsgo86oh.htm
Aan de hand van de Histogram of x-grafiek kunnen we besluiten dat er een bijna normaalverdeling is.

De Density Plot-grafiek is de afgevlakte versie van de Histogram of x-grafiek. We hebben geen enkele reden om te zeggen dat hier geen normaalverdeling zou zijn.

 We hebben dus te maken met een gelijke spreiding.

Op de Normal Q-Q Plot-grafiek zien we dat de punten bijna allemaal mooi op een rechte lijn liggen. Dit betekent dat we dicht bij een normale verdeling aanleunen.

- Assumptie 3 (is the deterministic component constant? (the model assumes that the distribution has a fixed location))
http://www.freestatistics.org/blog/date/2008/Nov/01/t1225547853wu7m5yipsgo86oh.htm

We kijken naar de Run Sequence Plot-grafiek. We kijken naar de lange termijn trend. Blijft het niveau constant? We zien een achteruitgang. Dit betekent dat het niveau niet constant blijft. Er is een dalende trend.

- Assumptie 4 (does the random component have a fixed variation? (the model assumes a distribution with fixed variation))
http://www.freestatistics.org/blog/date/2008/Nov/01/t1225547853wu7m5yipsgo86oh.htm

In de Run Sequence Plot-grafiek kunnen we zien dat er een vaste spreiding is.

Yt = c + ct
ct (random component): dit kunnen we niet voorspellen, omdat dit normaal verdeeld is.
c (constante): dit kunnen we wel voorspellen.
Ft = Yt - ct = c = de voorspelling

We gaan het gemiddelde (15323.275) als constante gebruiken. In de R-code vervangen we x door x - 15323.275.

http://www.freestatistics.org/blog/date/2008/Nov/01/t1225548604lcs3wwtudr96hsm.htm
Het gemiddelde ligt nu rond nul.

==> Besluit: het model is niet geldig, omdat niet aan alle validiteitvoorwaarden is voldaan.

Post a new message
Dataseries X:
17272.1
19769.9
20038.9
18173.4
16414.3
16938.7
18395.3
17284.5
16457.6
19396.4
16854
16956.1
15467.4
18154.3
17568.6
18063.7
15692.4
15155.4
17396.1
16803.3
15533
19268.2
16247.7
16012.5
16979.9
17504
15130
16677.5
13836.8
13028.1
15937.8
14734.4
14985.2
17197.3
14711.2
13333.7
14931.4
15000.7
14247.9
15525.5
12002.4
12642.6
15620.1
12543.6
13729.7
15456.4
13297.3
12223.3
13174.6
13123.5
13805.7
13816.6
10376.3
11989.9
13121.7
11986.4
12730.9
13687.6
12731.1
12261.6




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19647&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19647&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19647&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations60
minimum10376.3
Q113324.6
median15461.9
mean15323.275
Q316962.05
maximum20038.9

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 60 \tabularnewline
minimum & 10376.3 \tabularnewline
Q1 & 13324.6 \tabularnewline
median & 15461.9 \tabularnewline
mean & 15323.275 \tabularnewline
Q3 & 16962.05 \tabularnewline
maximum & 20038.9 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19647&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]60[/C][/ROW]
[ROW][C]minimum[/C][C]10376.3[/C][/ROW]
[ROW][C]Q1[/C][C]13324.6[/C][/ROW]
[ROW][C]median[/C][C]15461.9[/C][/ROW]
[ROW][C]mean[/C][C]15323.275[/C][/ROW]
[ROW][C]Q3[/C][C]16962.05[/C][/ROW]
[ROW][C]maximum[/C][C]20038.9[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19647&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19647&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations60
minimum10376.3
Q113324.6
median15461.9
mean15323.275
Q316962.05
maximum20038.9



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')