Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationFri, 24 Oct 2008 08:37:31 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/24/t1224859099r68cb036iraulgd.htm/, Retrieved Sun, 19 May 2024 13:37:13 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18627, Retrieved Sun, 19 May 2024 13:37:13 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact190
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-10-24 14:37:31] [a3db428e3d00990025d790b4cc7b8bfa] [Current]
- RMP       [Central Tendency] [Q2 central tendency] [2008-11-02 12:13:50] [c993f605b206b366f754f7f8c1fcc291]
-   P       [Univariate Explorative Data Analysis] [verbetering student] [2008-11-03 18:12:49] [85134b6edb9973b9193450dd2306c65b]
- R P       [Univariate Explorative Data Analysis] [verbetering oefening] [2008-11-03 18:29:41] [85134b6edb9973b9193450dd2306c65b]
Feedback Forum
2008-11-03 18:14:03 [Nathalie Boden] [reply
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225735999b3d14khnwgk3qae.htm
2008-11-03 18:32:52 [Nathalie Boden] [reply
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225735999b3d14khnwgk3qae.htm Ik heb hier het aantal lags veranderd in 36, zo beschik je over meer gegevens.

Bij assumptie 1: hier gaan we kijken naar de 1ste lagplot en de laatste lagplot. Zo zien we dat er bij de eerste grafiek met 1 periode is vertraagd. We zien hier dat de autocorrelatie bijna nul en maar licht positief is. Bij de laagste lagplot spreken we van een positieve seizonale autocorrelatie. Zo kunnen we kijken naar dezelfde maanden van vorig jaar en 2 jaar geleden. Zo zien we bij lag 12 dat de 12de correlatiecoëfficiënt zeer groot is.
Conclusie= de tijdsreeks is niet random, ze bevat wel degelijk autocorrelatie naar seizonale autocorrelatie.

Bij assumptie 2: hier kijken we naar het histogram. Hier zien we een min of meer normale verdeling. Ook bij de density plot lijkt de grafiek sterk op een normale verdeling. Bij de normal q-q plot zien we dat de meeste punten vrij dicht op de lijn liggen, maar zien we dat het niet perfect normaal verdeelt is.
Conclusie= we zitten vrij dicht bij een normale verdeling, ondanks er geen autocorrelatie is

Bij assumptie 3: Om het gemiddelde te zien is het best om de module 'central tendency' toe te passen op deze reeks.we zien dat het gemiddelde schommelt rond de 87. We vermoeden dat er een dalende tendens is op lange termijn. Outliers hebben er geen invloed op.

Bij assumptie 4: outliers hebben geen effect op het gemiddelde. We gaan hier kijken naar de 'run sequence plot'. Hier zien we dat het linkergedeelte harder schommelt dan het rechtergedeelte. We gaan ook kijken naar periodes waar de spreiding groter of kleiner is. Dit kunnen we doen door in de module de r-code aan te passen x <- x - 86.8934426229508 We zien hier op de grafiek dat het gemiddelde rond 0 ligt. Het resultaat vinden we terug onder volgende link:
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225737047pm3uatlonqaxmfi.htm
2008-11-03 19:18:22 [Ellen Van Ham] [reply
assumptie 1: random drawings? (onafhankelijke toevallige trekkingen)
We bekijken dit via autocorrelatie en lag plot, niet via de run sequence plot zoals de student van vorig jaar heeft gedaan. Hierbij kan men besluiten dat de tijdreeks niet random is, ze bevat autocorrelatie (meer bepaald seizonale correlatie). Het aantal lags kan je best op 36 zetten.

assumptie 2: fixed distribution? (vaste verdeling):
We bekijken dit via het histogram en density plot. We kunnen min of meer spreken van een normaalverdeling. Bij de normal Q-Q plot liggen de meeste punten op de lijn. Ondanks dat we toch geen autocorrelatie hebben, kunnen we toch spreken van een normaalverdeling.

assumptie 3: fixed location? (vaste locatie)
We vermoeden dat er een dalende trend is, maar dit is moeilijk te zien. We kunnen dit ook bekijken via central tendency (is het gemiddelde constant?).

assumptie 4: fixed variation (gelijke spreiding).
Dit beoordelen we via de run sequence plot. In het begin schommelt de tijdreeks harder.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18627&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18627&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18627&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18627&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18627&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18627&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')