Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Thu, 23 Oct 2008 10:39:26 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224780051f8emlujcam07lrd.htm/, Retrieved Sun, 19 May 2024 14:10:33 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18549, Retrieved Sun, 19 May 2024 14:10:33 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

138

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Univariate Explorative Data Analysis] [investigating dis...] [2008-10-23 16:39:26] [4f54996111e63ee83b19b6a8540c6bad] [Current]
-   PD    [Univariate Explorative Data Analysis] [asses Q2] [2008-11-03 16:08:34] [3d2d096cc21c6f80db3dd7b8e12effce] 
-   P       [Univariate Explorative Data Analysis] [asses Q2] [2008-11-03 16:10:13] [3d2d096cc21c6f80db3dd7b8e12effce] 

Feedback Forum

2008-10-29 18:31:01 [Romina Machiels] [reply] 
Er zijn 4 assumpties, dit had de student goed opgemerkt. 
Assumptie 1: Deze vraag werd niet goed beantwoord. Of de tijdreeks autocorrelatie vertoond moet je aflezen op de Lag-plot. Deze grafieken komen bij haar echter niet te voorschijn omdat zij bij de berekening niet het aantal lags heeft ingevuld. Hier had 12 of 36 moeten staan.  
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225300234x8jti5g72uddtjs.htm 
De puntenwolk licht dichter bij elkaar, dus er is wel degelijk sprake van correlatie, het is echter wel seizonale correlatie. De tijdreeks is niet random, maar er is wel degelijk sprake van seizonale correlatie. 
 
Assumptie 2: Dit werd ook niet juist beantwoord, ze heeft de grafieken fout beoordeeld. Het is wel juist dat je dit moet aflezen op het histogram en eventueel de density plot. Er is op beide grafieken een klein hobbeltje. Dit is niet groot genoeg om aandacht aan te besteden. De tijdreeks vertoont dus een normale verdeling. 
 
Assumptie 3: Deze vraag werd fout beantwoord, er werd ook naar de foute grafiek gekeken. Je moet kijken naar de run sequency plot, hierop zie je lichte achteruitgang. Iets bijkomend om naar te kijken is central tendency. Hier kan je kijken naar het gemiddelde of deze constant is, dit is hier het geval, het schommelt namelijk rond de 87. De outliërs hebben niet echt invloed. 
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225300825i0jr3gtw9zfly6o.htm 
 
Assumptie 4: Deze vraag werd fout beantwoord. Je hebt niet de lag-plot nodig, maar wel de run sequency plot. Als je deze grafiek in 2 splitst, zie je dat de spreiding in het 1ste deel groter is dan in het 2de deel. 
De vraag heeft ook betrekking op de random component, dus je kan bij het berekenen de R-module veranderen nl. x = -0,86... (het gemiddelde)dus dan trek je de voorspelling af en zie je nog beter dat de spreiding niet dezelfde is. 
 
De assumpties werden niet goed beoordeeld, er werd ook te weinig informatie gegeven waarom ze het zo dacht. De student had de vraag niet echt begrepen.
2008-11-03 16:32:45 [Joren Nuyts] [reply] 
Q2:  Er werd opgemerkt dat er 4 assumpties gecontroleerd moesten worden maar de interpretatie van de gegevens is niet correct 
 
Bij assumptie 1 heb ik een verbeterde link gemaakt zodat de lags van 12 en 36 erin vermeld worden. 
lag 12 =>http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225728547xdyin0slsdsqivi.htm 
 
Lag 36: http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t122572864186bty5bx9tvrfx0.htm 
 
Na het bekijken van de grafieken merken we dat de lag plot als grafiek moet gebruikt worden. Er is geen correlatie omdat de puntenwolk niet op de rechte ligt. 
Na assumptie 1 kunnen we ervan uitgaan dat de tijdreeks niet random is want het bevat seizonale autocorreltaie. 
De student maakt hier een verkeerde interpretatie. 
 
Bij assumptie 2 wordten de gegevens niet juist ge¨nterpreteerd. Bekijken we het normal QQ-plot merken we dat het vrij dicht bij een normaalverdeling ligt. 
De student zegt hier dat de schommelingen te groot zijn om op een normaalverdeling te trekken. 
 
Bij assumptie 3 wordt er gekeken naar de verkeerde grafiek.  Hier moeten we kijken naar het run sequence plot. Hier kijken we naar de lange termijn en bemerken we een achteruitgang. 
Hier merken we dat op lange termijn het niet constant is maar dit is redelijk moeilijk te achterhalen. 
We achterhalen dit door het gemiddelde te berekenen met de central tendensy: 
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225727379l4wcq5qyq2l3qmj.htm 
 
In assumptie 4 bekijken we de random component.  Deze vraag werd fout beantwoord door de student want er wordt hier naar de lag plot gekeken. Hier moeten we kijken naar het run sequence plot. We bestuderen hier de spreding van de reeks over de tijd heen. 
Om dit te doen, splitsen we de grafiek in 2 delen en kijken we of de spreiding groter of kleiner is dan in het andere deel. We merken hier op dat in het eerste deel er meer schommeling is dan in het tweede deel.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18549&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18549&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18549&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18549&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18549&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18549&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 0 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code