Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 18:25:19 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/28/t12251535764gt7f48rycrb6bw.htm/, Retrieved Sun, 19 May 2024 21:36:00 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19721, Retrieved Sun, 19 May 2024 21:36:00 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact202
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Tukey lambda PPCC Plot] [Investigating Dis...] [2007-10-21 16:01:20] [b9964c45117f7aac638ab9056d451faa]
F RMPD    [Univariate Explorative Data Analysis] [Q2] [2008-10-28 00:25:19] [40845526110da2d5a5bf7b165da84e03] [Current]
-   PD      [Univariate Explorative Data Analysis] [correctie] [2008-11-03 21:01:33] [631938996a408f8d8cf3d9850ca0cd03]
-   P         [Univariate Explorative Data Analysis] [correctie 1] [2008-11-03 21:09:29] [631938996a408f8d8cf3d9850ca0cd03]
Feedback Forum
2008-11-02 11:18:17 [Jeremy Leysen] [reply
Indien je de 'lags' invoert, zal je de laatste grafieken wél te zien krijgen. Tip: kies voor een lag = 12 of 36.
2008-11-03 09:36:17 [a7e076854c32462fd499d2de3f6d4e86] [reply
Het definitieve besluit dat de reeks niet voldoet, is correct (er wordt niet aan de 4 assumpties voldaan).
Het testen van deze assumpties is niet steeds correct.
Voorbeeld: bij de eerste assumptie moeten we ook naar de laatste grafiek kijken. Die wordt weergegeven als we de 'lags' invullen (12 of 36).
Bij assumptie 2: kijken naar het histogram en density plot OF normal Q-Q plot
Bij assumptie 4: kijken naar de run sequence plot (spreiding van de reeks over de tijd heen)
2008-11-03 19:19:03 [Jan Helsen] [reply
Ik ga akkoord met bovenstaande commentaren. Voor de eerste assumptie had je ook naar de lag plot moeten kijken. Daarvoor moet je wel zoals hierboven vermeld je lags invoeren. Let er wel op dat dit enkel mogelijk is voor tijdreeksen.
Probeer ook niet alleen het resultaat te beschrijven, maar ook telkens een antwoord te geven op het feit dat er aan de assumptie wordt voldaan of niet.
Bij assumptie 2 is er een lichte bobbel aan de linkerkant maar deze is niet relavant aangezien het op een beperkt afwijking gaat.
Assumptie 4 vertoont een lichte daling wanneer je het geheel op lange termijn bekijkt dus er wordt niet voldaan.Je moet hiervoor de run sequence plot gebruiken.
2008-11-03 21:28:46 [Kristof Francken] [reply
het is inderdaad een tijdreeks die niet aan alle voorwaarden voldoet. Toch zijn er meerdere fouten die hij heeft gemaakt bij de assumpties:

Assumptie 1: Random drawning
De student heeft wel geen lag-plot gebruikt. Om de lagplot te gebruiken moet je de lags invoeren (in dit geval 12, eventueel 36).
http://www.freestatistics.org/blog/date/2008/Nov/03/t122574618549bqqdcfbj5uism.htm
In bovenstaande link kunnen we zien dat bij de lagplot K=1 alle punten gespreid liggen rond de rechte, dus correlatie (maatstaf die aangeeft in welke mate de punten op een rechte ligt) is bijna nul.
Lag K=12 toont ons dan weer een positieve autocorrelatie dat wijst op een positieve seizoenale correlatie. Als we dan het aantal lags in vullen tot 36, http://www.freestatistics.org/blog/date/2008/Nov/03/t1225746614i199xfyzwgk465t.htm dan kun je duidelijk zien in de laatste illustratie dat er een seizoenale correlatie is.

Assumptie 2: fixed distribution
Hiervoor moeten we inderdaad naar histogram en density plot kijken. Er is in tegenstelling tot wat de student beweert, wel een bijna-normale verdeling te zien. Als we dan naar de Normal QQ-plot kijken kunnen we zien dat de quantielen sterk op een normaal verdeling lijken, met enkel links een kleine afwijking.

Assumptie 3: fixed location
We kunnen voor deze assumptie beter kijken naar de run-sequence plot. Op LT is het niet constant, want er is een achteruitgang bezig.

Assumptie 4: fixed variation
Hiervoor hebben we de runsequence plot nodig om te zien naar de spreiding van de reeks over de tijd heen. Er is duidelijk te zien dat er een verandering van spreiding is.

Post a new message
Dataseries X:
109,20
88,60
94,30
98,30
86,40
80,60
104,10
108,20
93,40
71,90
94,10
94,90
96,40
91,10
84,40
86,40
88,00
75,10
109,70
103,00
82,10
68,00
96,40
94,30
90,00
88,00
76,10
82,50
81,40
66,50
97,20
94,10
80,70
70,50
87,80
89,50
99,60
84,20
75,10
92,00
80,80
73,10
99,80
90,00
83,10
72,40
78,80
87,30
91,00
80,10
73,60
86,40
74,50
71,20
92,40
81,50
85,30
69,90
84,20
90,70
100,30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19721&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19721&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19721&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19721&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19721&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19721&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')