Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 13:06:15 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225134463jtqup8dbvoikm35.htm/, Retrieved Sun, 19 May 2024 14:05:52 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19422, Retrieved Sun, 19 May 2024 14:05:52 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact174
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
-    D  [Univariate Explorative Data Analysis] [investigation dis...] [2008-10-27 17:49:03] [4ad596f10399a71ad29b7d76e6ab90ac]
F   PD      [Univariate Explorative Data Analysis] [investigating dis...] [2008-10-27 19:06:15] [577b699a0819d2125728ba9ae2c57238] [Current]
- RMP         [Central Tendency] [feedback taak 3 t...] [2008-10-29 13:39:13] [46c5a5fbda57fdfa1d4ef48658f82a0c]
Feedback Forum
2008-10-29 13:41:00 [Ken Van den Heuvel] [reply
Q7:
Assumption 1: Are the data autocorrelated?
Je stelt: Wat bij mijn tijdsreeks niet echt het geval is omdat het een stijgend verloop heeft en niet flat is en er is geen constante terugkerende patroon.

Je verward dit met vaste locatie...een stijgend verloop van de Run Sequence Plot heeft niets te maken met autocorrelatie.
Als je naar de autocorrelation plot kijkt dan zie je duidelijk sterkte autocorrelatie over de gehele lijn...op de Run Sequence Plot zelf zijn trouwens ook seizoenstendensen op te merken (stijging gevolgd door een stagnatie).

Assumption 3: Is the deterministic component constant? (The model assumes that the distribution has a fixed location)
In de grafiek van de Normal QQ plot kunnen we zien dat de punten helemaal niet op een rechte liggen. Maar ze hebben eerder de vorm van de Run sequence plot.

Beter was om naar de central tendency te kijken, meer bepaald naar de mean plots (winsorizes/trimmed) om dit na te gaan (blijven deze gelijk over het gehele verloop of veranderen ze?).

Dat de QQplot de vorm heeft van de Run Sequence Plot doet hier eigenlijk weinig ter zake. De QQplot is sowieso niet erg geschikt om over deze assumptie te oordelen.

Assumption 4: does the random component have a fixed variation? (The model assumes a distribution with fixed variation)
Je stelt: Bij mijn tijdsreeks geldt dit wel er is een “zelfde” terugkerende patroon op de horizontale as.

Wederom controleren via central tendency van de reeks. Je kijkt dan naar de S.E. bij de arithmetic mean. Deze zou 0 (of bijna 0 moeten zijn) en de plots zouden dus binnen het betrouwbaarheidsinterval moeten liggen (de stippellijnen op de grafieken).

http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225287588nlt1zjdjgghpynx.htm

Bovenstaande link kan je gebruiken ter verificatie van assumptie 3 & 4.
2008-10-29 13:46:01 [Ken Van den Heuvel] [reply
Q10:

Je stelt: De tijdsreeks is niet seizoengebonden. Omdat de regel geldt: “If the randomness assumption holds then the lag plot will be structureless and random. Wat hier niet het geval is want hier ziet men een zeer duidelijke structuur. Kan men ook duidelijk zien bij de autocorrelatlon function.

Seizoensgebondenheid = autocorrelatie...je conclusie lijkt me dus enigszins verwarrend. Autocorrelatie wijst op verbanden tussen data en de daar op voorgelegen data. Het controleert dus of er patronen, gelijkenissen zitten in de reeks. Een terugkerend patroon (= autocorrelatie) wijst dus op een seizoenstendens!

Op de Run Sequence Plot is dit trouwens ook te zien. Ongeveer om de 10 (maanden?) stappen zien we een terugkerend patroon van stijging en stagnatie.
2008-11-02 12:58:17 [Ciska Tanghe] [reply
Bij Q7 moeten de vier assumpties opnieuw getest worden.

Bij assumptie 1 spreek je over het verloop van de Run Sequence Plot, maar dat doet niets ter zake. Je moet kijken naar de lag-plot. Als je naar deze grafiek kijkt, zie je heel duidelijk dat alle punten op één rechte lijn liggen. Hieruit volgt dat er grote correlatie is.

Bij assumptie 3 gebruik je de QQ-Plot, maar dat haalt niets uit. Het is beter om de Central Tendency te gebruiken en te kijken naar de winsorized en trimmed mean.
2008-11-02 13:02:02 [Ciska Tanghe] [reply
Om te weten of er seizoenaliteit is, kijken we naar de Run Sequence Plot. We zien een terugkerend verloop van de grafiek. Daaruit besluiten we dat er seizoenaliteit is.
2008-11-02 14:13:49 [Roland Feldman] [reply
Bij Q7: hier moest ik kijken naar de autocorrelatie bij assumptie 1
bij assumptie 3 moest ik niet naar de QQ plot kijken maar de central tendency berekenen

BIj Q10: Er is een sterke autocorrolatie dit betekent seizoengebonden.

Post a new message
Dataseries X:
58.44
58.96
59.43
60.03
60.47
60.48
60.68
60.77
60.91
60.95
60.95
60.95
60.93
60.93
60.93
60.93
61.8
62.74
62.86
62.86
62.92
62.92
62.92
62.92
62.95
64.17
65.33
65.68
65.97
66.58
66.78
66.83
66.85
66.86
66.86
66.86
66.96
67.66
68.44
68.56
68.65
68.68
68.69
68.71
68.71
68.82
69.75
70.43
70.91
71.47
71.87
72.31
72.56
73.23
73.57
73.72
73.68
73.76
73.76
73.78




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19422&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19422&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19422&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations60
minimum58.44
Q160.95
median66.68
mean65.9846666666667
Q368.7375
maximum73.78

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 60 \tabularnewline
minimum & 58.44 \tabularnewline
Q1 & 60.95 \tabularnewline
median & 66.68 \tabularnewline
mean & 65.9846666666667 \tabularnewline
Q3 & 68.7375 \tabularnewline
maximum & 73.78 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19422&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]60[/C][/ROW]
[ROW][C]minimum[/C][C]58.44[/C][/ROW]
[ROW][C]Q1[/C][C]60.95[/C][/ROW]
[ROW][C]median[/C][C]66.68[/C][/ROW]
[ROW][C]mean[/C][C]65.9846666666667[/C][/ROW]
[ROW][C]Q3[/C][C]68.7375[/C][/ROW]
[ROW][C]maximum[/C][C]73.78[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19422&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19422&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations60
minimum58.44
Q160.95
median66.68
mean65.9846666666667
Q368.7375
maximum73.78



Parameters (Session):
par1 = 0 ; par2 = 12 ;
Parameters (R input):
par1 = 0 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')