Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Sun, 26 Oct 2008 11:53:00 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/26/t1225043621cpelhtzf3splybo.htm/, Retrieved Sun, 19 May 2024 16:37:34 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18993, Retrieved Sun, 19 May 2024 16:37:34 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

180

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD    [Univariate Explorative Data Analysis] [Task 1 Q2] [2008-10-26 17:53:00] [07b7cf1321bc38017c2c7efcf91ca696] [Current]

Feedback Forum

2008-11-03 09:20:12 [Lindsay Heyndrickx] [reply] 
nr1: Hier heeft de student gekeken naar de run sequence plot. Dit is niet verkeerd maar hier kun je autocorrelatie heel moeilijk op aflezen Het aantal lags is hier 12 of 36 want je werkt hier met een tijdreeks (als het geen tijdreeks is geen lags ingeven.) lag twee heeft een positieve seizonale correlatie.=>de punten liggen dicht bij elkaar en ze hebben een positieve helling. De tijdreeks is hier dus niet random want ze bevat autocorrelatie met seizonale betekenis 
 
nr2: Hier is de grafiek niet volledig bell shaped maar hier is inderdaad een normaalverdeling. Dit is een goed antwoord 
 
nr3: Hier moet je de run sequence plot gebruiken. Als je wilt kijken of het gemiddelde constant is moet je de central tendancy toepassen. Het gemiddelde is hier ongeveer constant. Het schommelt een beetje rond de 87.  Hier is dus wel degelijk een constante. 
 
nr 4: Hier moet je de run sequence plot gebruiken.  Je moet hier naar de spreiding van de reeks kijken over de tijd heen.in het eerste deel zijn de observaties hier meer gespreid door de tjid heen is er een verandering in marges.  
Je kan de tijdreeks ontbinden in twee delen: in een constante en een variabele. Door het constante deel kan je een voorspelling doen. 
Als je in de tijdreeks het gemiddelde aftrekt dan krijg je dezelfde run sequence plot maar het gemiddelde schommelt nu rond nul. Dit wil zeggen dat er inderdaad een vaste spreiding is. 
2008-11-03 22:31:48 [Bart Haemels] [reply] 
Assumption 1:  
Om de autocorrelatie te berekenen maken we geen gebruik van de run sequency plot maar van de autocorrelation plot. Aan de hand van de autocorrelation plot kunnen we de volgende vraag stellen: Wat is het verband tussen het heden en het verleden?  
Als er autocorrelatie bestaat zou men voorspellingen kunnen maken voor bv. de volgende maand.  
Als we de lag plot voor 36 maanden bekijken kunnen we zien dat er een positieve seizonale correlatie is. Dit wil zeggen dat men niet per maand maar wel per jaar ongeveer kan voorspellen welke trend er zich zal voordoen.  
 
Assumption 2:  
Hier heb ik gelijk dat er een vrij gelijke spreiding is. We kunnen hier dus spreken van een min of meer normaalverdeling. Bovendien moet er niet alleen naar het histogram worden gekeken maar ook naar het Q-Q plot, hier liggen de punten zo goed als allemaal op 1 rechte.  
Dit bewijst nogmaals dat we kunnen spreken van een normaalverdeling.  
 
Assumptie 3:  
Hier moeten we naar de run sequency plot kijken en niet naar de Q-Q plot zoals ik in mijn taak beweerde. Uit de run sequency plot zien we dat de frequency zachtjes daalt en dus niet constant is.  
 
Assumptie 4:  
Hier moeten we kijken naar de spreiding van de reeks over de tijd. Als we de grafiek bekijken ( run sequence plot) zien we dat deze spreiding schommelt over de tijd. In het eerste deel is deze spreiding groter. 
 
Ik kan er nog aan toevoegen dat aangezien het om een tijdreeks ik de lag had moeten invullen. Ik had deze best op 36 gezet zodat ik seizoenaliteit kon opmerken.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18993&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18993&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18993&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18993&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18993&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18993&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0.01 ; par2 = 0.99 ; par3 = 0.01 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ; par3 = ; par4 = ; par5 = ; par6 = ; par7 = ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code