Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 12:57:16 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t12251338848joagpj51c4v7fc.htm/, Retrieved Sun, 19 May 2024 15:37:57 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19410, Retrieved Sun, 19 May 2024 15:37:57 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact176
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD    [Univariate Explorative Data Analysis] [Blog Q2] [2008-10-27 18:57:16] [a8228479d4547a92e2d3f176a5299609] [Current]
-   P       [Univariate Explorative Data Analysis] [Reproduce verkeer...] [2008-10-29 13:36:39] [ed2ba3b6182103c15c0ab511ae4e6284]
- RMP         [Central Tendency] [central tend ] [2008-10-29 13:47:37] [ed2ba3b6182103c15c0ab511ae4e6284]
-    D        [Univariate Explorative Data Analysis] [random component] [2008-10-29 13:55:42] [ed2ba3b6182103c15c0ab511ae4e6284]
Feedback Forum
2008-10-29 13:58:23 [Tom Ardies] [reply
De herberekening klopt, maar ik had beter de lags op 12 of meer gezet. Hier is nieuwe correcte link voor het toetsen van de data: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t12252874301t29xy3nalko90s.htm

Zal mijn commentaal hier bij schrijven:

assumptie 1: willekeurige data, als men naar de de eerste lag plot kijkt dan kan men zien dat er geen patroon in de data is. De autocorrelation toont iets anders aan (zie nieuwe link). Bij lag 12 en 24 is er een duidelijke sprong in de correlatie wat wijs op seizonaliteit.

assumptie 2: De data ziet er normaal verdeeld uit. Dit kan men zien aan de histogram en de density plot.

assumptie 3: De data moet op een constante lijn liggen. op het zicht ziet men dat de data ligt daalt. Maar je kan dit ook met de central tendency, de robuustheid bekijken. http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t1225288086i8oumb4wiuwx1hb.htm Men kan door de robuustheid grafiek een rechte trekken dat evenwijdig is met x-as, waarbij alle data nog binnen de 95% betrouwbaarheidsinterval ligt.

assumptie 4: de willekeurige component moet dezelfde spreiding hebben over de hele grafiek. In de volgende link heb ik de mediaan van de reeks afgetrokken om de spreiding te analyseren. http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/29/t12252885749sdm7ftkroa0eox.htm Je kan duidelijk zien dat de spreiding in het begin iets groter is dan over de helft

Het model is dus niet van toepassing.
2008-11-01 12:33:56 [Matthieu Blondeau] [reply
Het is inderdaad zo dat de lags verandert moest worden. Ik zou zeggen dat aan het model wel is voldaan omdat aan alle assumpties is voldaan, ook de laatste. Ik vind dat er een vrij gelijke verdeling is van de grafiek.
2008-11-03 08:51:38 [Jeroen Michel] [reply
Je hebt de fout inderdaad goed beoordeeld en deze ook herberekend. Dit geef je weer door de links van de nieuwe berekeningen er bij te posten. Onderstaande links geven mijn beredenering weer, bekijk deze zeker en vast goed de bijgevoegde feedback:

http://www.freestatistics.org/blog/date/2008/Oct/28/t1225153355pgrr9krt7tyyopr.htm
2008-11-03 19:22:20 [Joris Deboel] [reply
Mijn collega's en tom zelf hebben de vraag goed geanalyseerd, ik kan dus niets anders doen dan mij hier bij aan te sluiten.
2008-11-03 21:32:38 [Bart Haemels] [reply
Assumption 1:
Om de autocorrelatie te berekenen maken we geen gebruik van de run sequency plot maar van de lag plot. Aan de hand van de lag plot kunnen we de volgende vraag stellen: Wat is het verband tussen het heden en het verleden?
Als er autocorrelatie bestaat zou men voorspellingen kunnen maken voor bv. de volgende maand.
Als we de lag plot voor 36 maanden bekijken kunnen we zien dat er een positieve seizonale correlatie is. Dit wil zeggen dat men niet per maand maar wel per jaar ongeveer kan voorspellen welke trend er zich zal voordoen.

Assumption 2:
Hier heeft de student inderdaad gelijk dat er een vrij gelijke spreiding is. We kunnen hier dus spreken van een min of meer normaalverdeling. Bovendien moet er niet alleen naar het histogram worden gekeken maar ook naar het Q-Q plot, hier liggen de punten zo goed als allemaal op 1 rechte.
Dit bewijst nogmaals dat we kunnen spreken van een normaalverdeling.

Assumptie 3:
Hier moeten we naar de run sequency plot kijken. Uit de run sequency plot zien we dat de frequency zachtjes daalt en dus niet constant is.

Assumptie 4:
Hier moeten we kijken naar de spreiding van de reeks over de tijd. Als we de grafiek bekijken ( run sequence plot) zien we dat deze spreiding schommelt over de tijd. In het eerste deel is deze spreiding groter.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19410&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19410&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19410&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19410&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19410&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19410&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 10 ;
Parameters (R input):
par1 = 0 ; par2 = 10 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')