Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Mon, 27 Oct 2008 03:34:51 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225100171q0i4nxj6uumuqrl.htm/, Retrieved Sun, 19 May 2024 15:39:02 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19140, Retrieved Sun, 19 May 2024 15:39:02 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

217

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Data Series] [Beurskoers Eurone...] [2008-10-13 22:20:32] [82970caad4b026be9dd352fdec547fe4]
-   PD  [Univariate Data Series] [Beurskoers Eurone...] [2008-10-20 20:09:06] [82970caad4b026be9dd352fdec547fe4]
F RMPD      [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-10-27 09:34:51] [c33ddd06d9ea3933c8ac89c0e74c9b3a] [Current]
- R  D        [Univariate Explorative Data Analysis] [r-code aanpassen] [2008-10-28 20:46:29] [8eb83367d7ce233bbf617141d324189b] 
- RMPD        [Central Tendency] [Investigating Dis...] [2008-10-31 12:58:19] [82970caad4b026be9dd352fdec547fe4] 
-    D        [Univariate Explorative Data Analysis] [Q2 lag 12] [2008-11-02 13:12:04] [299afd6311e4c20059ea2f05c8dd029d] 
-   PD        [Univariate Explorative Data Analysis] [Q2 lag 36] [2008-11-02 13:14:20] [299afd6311e4c20059ea2f05c8dd029d] 
- RMP           [Central Tendency] [Q2 - Fixed location] [2008-11-02 13:25:46] [299afd6311e4c20059ea2f05c8dd029d] 
-    D            [Central Tendency] [Q2 - Central Tend...] [2008-11-02 13:28:16] [299afd6311e4c20059ea2f05c8dd029d] 
-   PD        [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-02 17:38:39] [38f43994ada0e6172896e12525dcc585] 
-   PD        [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-02 17:38:39] [38f43994ada0e6172896e12525dcc585] 
-   P           [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-02 18:02:16] [38f43994ada0e6172896e12525dcc585] 
-   P           [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-11-02 18:02:16] [38f43994ada0e6172896e12525dcc585] 
- RMP             [Central Tendency] [Investigating Dis...] [2008-11-02 18:20:43] [38f43994ada0e6172896e12525dcc585] 

Feedback Forum

2008-10-30 13:47:17 [Gregory Van Overmeiren] [reply] 
Assumptie 1 doe je heel goed (ik dacht dat dit ook het vb was van in de college) We moeten idd kijken naar de autocorrelation function of het lagplot. 
 
Onder het lag-plot zie je lags(xk=1) staan wat wil zeggen dat de tijdreeks met 1 periode vertraagd is.. => hier kan je geen voorspelling maken voor volgend jaar. We merken ook een rechte lijn op in de grafieken een puntenwolk die rond deze rechte liggen=> dwz dat de autocorrelatie = bijna 0. (zoals je zelf ook aanhaalt) 
 
De laatste grafiek (autocorrelation function) geeft een samenvatting van de puntenwolk. Deze sluit veel dichter aan bij deze rechte wat wijst op een positieve seizoenale autocorrelatie.  
 
Nu kunnen we wel een voorspelling maken naar volgend jaar toe. dit doen we door de #lags in de autocorrelation function op 36 te zetten ipv 12.  
(http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225320516y5f46ttv246tbv1.htm)  
We zien dat op lag 12 de correlatie zeer groot is en ,niet toevallig, ook op lag 24 (2x12). We hebben hier dus een duidelijke seizoenale autocorrelatie. 
2008-10-30 13:50:09 [Gregory Van Overmeiren] [reply] 
QQ plot zien we dat de punten een beetje afwijken van de rechte dwz dat het niet perfect normaal verdeeld is maar we liggen er zeer dicht bij.  
 
Voor assumptie 3 zou ik eerder kijken naar central tendency. We zien dat het gemiddelde fluctueert maar schommelt rond 87 (http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/30/t12253256749n8j4m79im0ov8x.htm) dwz dat de ouliers er geen groot effect op hebben. We vermoeden dat er een dalende trend is maar dit is moeilijk te zien op lange termijn.  
 
Voor assumptie 4 moeten we naar de run sequence plot kijken. Als we deze in 2 gelijke delen hakken zien we dat de spreiding in het eerste deel groter is dan in het tweede.Er is dus een verandering van spreiding.  
 
Je conclusie is juist, dit is idd geen geldig model omdat niet alle validiteitsvoorwaarden zijn voldaan
2008-10-30 13:53:07 [Gregory Van Overmeiren] [reply] 
Assumptie 2 ontbrak precies in m'n vorige post. Dit moest dus zijn => Voor assumptie 2 moeten we naar het density plot kijken. Er is dus wel degelijk sprake van een (min of meer) normaalverdeling=> zie histogram. Als we kijken naar de normal QQ plot zien we dat de punten een beetje afwijken van de rechte dwz dat het niet perfect normaal verdeeld is maar we liggen er zeer dicht bij. 
2008-11-03 09:50:38 [Karen Van den Broeck] [reply] 
Assumptie 1 heb je heel goed gedaan. Je moet hier inderdaad het lag plot gaan bekijken. 
De punten liggen gespreid rond de rechte dus de autocorrelatie is bijna nul en dan kunnen we geen uitspraak doen over de volgende maand. 
Wanneer we de laatste grafiek bekijken, zien we dat de puntenwolk een positieve helling heeft => positieve autocorrelatie van orde 12. Nu kunnen we wel een uitspraak doen over de toekomst (aantal lags in autocorrelatie functie op 36 i.p.v. 12 zetten) want het zijn altijd dezelfde maanden.  
De conclusie van assumptie 1 is dat de tijdreeks niet random is want ze bevat wel degelijk autocorrelatie maar het is speciale autocorrelatie namelijk seizonale autocorrelatie. 
 
Voor assumptie 2 gaan we naar het histogram en density plot zien. Op het histogram kunnen we zien dat er min of meer een normaalverdeling is. Density plot bult maar niet erg uitgesproken => dus normaalverdeling. 
 
Assumptie 3 heb je ook goed gedaan. Het mag niet fluctueren op lange termijn. We gaan kijken naar run sequence plot en dan zien naar de lange termijn trend. We zien op lange termijn een achteruitgang dus is het niet constant (dit is echter wel moeilijk te zien). 
 
Assumptie 4 heb je ook goed opgelost. Deze assumptie heeft betrekking op de random component. Heeft deze een vaste spreiding? Het antwoord is neen, want er zijn een paar outliers (deze hebben wel geen effect op het gemiddelde). We moeten gaan kijken naar run sequence plot. Wanneer we deze in 2 gelijke delen hakken, merken we op dat de spreiding in eerste deel groter is dan in het tweede. Over de tijd heen is er dus een verandering van de spreiding. 
 
Je conclusie is goed. Het is inderdaad zo dat niet aan alle voorwaarden voldaan is. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19140&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19140&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19140&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19140&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19140&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19140&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 12 ;

Parameters (R input):

par1 = 0 ; par2 = 12 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code