Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Mon, 27 Oct 2008 15:39:26 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225143603k3uool13vug6drb.htm/, Retrieved Tue, 28 May 2024 17:35:17 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19651, Retrieved Tue, 28 May 2024 17:35:17 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

170

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD  [Univariate Explorative Data Analysis] [Lag Plot] [2008-10-24 08:14:34] [87cabf13a90315c7085b765dcebb7412]
F           [Univariate Explorative Data Analysis] [Q2] [2008-10-27 21:39:26] [f6a332ba2d530c028d935c5a5bbb53af] [Current]

Feedback Forum

2008-10-28 20:13:51 [Ken Van den Heuvel] [reply] 
'1.	Fixed location: Is er een constante factor? NEEN' 
 
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225220484jswurbt3ibggf56.htm 
 
Best is om via central tendency dit even te verifieren, louter op het zicht via de Run Sequence Plot is nogal riskant. Uit mijn berekening blijkt dat de locatie niet altijd vast is over de gehele termijn, kijk maar naar de winzorised mean plot. Jouw bewering is dus correct. 
 
2.	Fixed variation: Liggen de observaties random verspreid? JA 
 
Hiervoor kan je bovenstaande link gebruiken, of deze nieuwe waar ik het gemiddelde van de x waarden heb afgetrokken om de error component over te houden. 
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225220321std1trcmlbp0m19.htm 
 
Je ziet dat de mean van de errors binnen het betrouwbaarheidsinterval ligt. De variatie zal dus vast zijn. 
  
3.	Fixed distribution: Is er sprake van een gelijke spreiding van de gegevens? JA 
 
Dit heb je correct nagegaan. 
4.	Randomness: Is de data geautocorreleerd? JA 
 
Een bedenking hier bij je beredenering. Autocorrelatie wijst op een verband tussen een gegeven en zijn voorgangers. Als iets autogecorreleert is, dan zal dit bijgevolg niet random zijn...gezien er seizoenstendensen aanwezig zijn. Je bewering dat er autocorrelatie is klopt dus wel, maar de conclusie die je hieruit trekt is deels foutief.
2008-11-03 06:38:33 [Jeroen Michel] [reply] 
Assumptie 1:  
Hierbij heb ik deze keer inderdaad gekeken naar de lag plot ipv. de run sequence plot. De resultaten zijn terug te vinden onder deze link:  
lag 1: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t12256648775yuu0x8xxg6fgch.htm, Retrieved Sun, 02 Nov 2008 22:28:06 +0000 Tevens houden we rekening met de puntenwolken zoals opgesomd door de vorige studente.  
 
lag 12: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665259gny0zbzwwq6rpqr.htm, Retrieved Sun, 02 Nov 2008 22:34:28 +0000  
 
lag 36: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665398n329mjtqxwani17.htm, Retrieved Sun, 02 Nov 2008 22:36:51 +0000  
 
Assumptie 2: 
Hier kan je misschien gebruik maken van volgende link.  
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225220321std1trcmlbp0m19.htm  
 
Assumptie 3: 
Dit is correct uitgevoerd. 
 
Assumptie 4: 
Correct, alleen is de eindconclusie niet echt volledig. Het is niet zo dat er dan sprake is van 'Random'.
2008-11-03 18:48:57 [Kevin Truyts] [reply] 
Bij de eerste veronderstelling is de studente naar de run-sequence plot gaan kijken om deze assumptie te beoordelen. Tijdens het college werd gezegd dat hiervoor naar de lag-plot moest worden gezien. Hiervoor diende de lag gelijk te stellen aan 12 of 36. Bij deze tijdreeks zien we dat de punten erg gespreid liggen op de grafiek en dat de autocorrelatie bijna gelijk is aan 0. Op de laatste grafiek zien we dat we hier te maken hebben met een seizonale correlatie/tijdreeks. Dit zien we aan het feit dat op de 12e en 24ste meting er zich telkens een piek voordoet die boven het 95%-betrouwbaarheidsinterval uitstijgt.  
Conclusie: de tijdreeks is niet rondom wegens de seizonale autocorrelatie.  
Tijdens de bespreking van de 2de assumptie werd er gezegd dat er slechts een kleine afwijking te zien is op het histogram en density-plot. Toch kunnen we dit beschouwen als een normaal verdeling en dit ondanks dat er geen autocorrelatie aanwezig is.  
Voor de 3de assumptie moest er worden gezien naar de central tendency. Hier kunnen we het gemiddelde aflezen dat schommelt rond 87. Hierdoor kunnen we besluiten dat, als er outliers zijn, deze geen directe invloed hebben op de tijdreeks. Dit is ook (moeilijk) af te lezen op de run-sequence plot. Op lange termijn is het niveau niet constant en zien we zelfs een lichte achteruitgang.  
Ook de 4de assumptie werd verkeerd beoordeeld. Hiervoor moest naar de run-sequence worden gezien. We bekijken dan de spreiding van de observaties. Hier onderscheiden we 2 delen. Deel 1 is groot en deel 2 is klein qua margeschommelingen.  
 
Hieruit kunnen we besluiten dat het model niet voldoet aan de voorwaarden. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19651&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19651&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19651&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19651&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19651&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19651&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 12 ;

Parameters (R input):

par1 = 0 ; par2 = 12 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code