Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 15:39:26 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225143603k3uool13vug6drb.htm/, Retrieved Tue, 28 May 2024 17:35:17 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19651, Retrieved Tue, 28 May 2024 17:35:17 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact170
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F   PD  [Univariate Explorative Data Analysis] [Lag Plot] [2008-10-24 08:14:34] [87cabf13a90315c7085b765dcebb7412]
F           [Univariate Explorative Data Analysis] [Q2] [2008-10-27 21:39:26] [f6a332ba2d530c028d935c5a5bbb53af] [Current]
Feedback Forum
2008-10-28 20:13:51 [Ken Van den Heuvel] [reply
'1. Fixed location: Is er een constante factor? NEEN'

http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225220484jswurbt3ibggf56.htm

Best is om via central tendency dit even te verifieren, louter op het zicht via de Run Sequence Plot is nogal riskant. Uit mijn berekening blijkt dat de locatie niet altijd vast is over de gehele termijn, kijk maar naar de winzorised mean plot. Jouw bewering is dus correct.

2. Fixed variation: Liggen de observaties random verspreid? JA

Hiervoor kan je bovenstaande link gebruiken, of deze nieuwe waar ik het gemiddelde van de x waarden heb afgetrokken om de error component over te houden.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225220321std1trcmlbp0m19.htm

Je ziet dat de mean van de errors binnen het betrouwbaarheidsinterval ligt. De variatie zal dus vast zijn.

3. Fixed distribution: Is er sprake van een gelijke spreiding van de gegevens? JA

Dit heb je correct nagegaan.
4. Randomness: Is de data geautocorreleerd? JA

Een bedenking hier bij je beredenering. Autocorrelatie wijst op een verband tussen een gegeven en zijn voorgangers. Als iets autogecorreleert is, dan zal dit bijgevolg niet random zijn...gezien er seizoenstendensen aanwezig zijn. Je bewering dat er autocorrelatie is klopt dus wel, maar de conclusie die je hieruit trekt is deels foutief.
2008-11-03 06:38:33 [Jeroen Michel] [reply
Assumptie 1:
Hierbij heb ik deze keer inderdaad gekeken naar de lag plot ipv. de run sequence plot. De resultaten zijn terug te vinden onder deze link:
lag 1: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t12256648775yuu0x8xxg6fgch.htm, Retrieved Sun, 02 Nov 2008 22:28:06 +0000 Tevens houden we rekening met de puntenwolken zoals opgesomd door de vorige studente.

lag 12: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665259gny0zbzwwq6rpqr.htm, Retrieved Sun, 02 Nov 2008 22:34:28 +0000

lag 36: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665398n329mjtqxwani17.htm, Retrieved Sun, 02 Nov 2008 22:36:51 +0000

Assumptie 2:
Hier kan je misschien gebruik maken van volgende link.
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225220321std1trcmlbp0m19.htm

Assumptie 3:
Dit is correct uitgevoerd.

Assumptie 4:
Correct, alleen is de eindconclusie niet echt volledig. Het is niet zo dat er dan sprake is van 'Random'.
2008-11-03 18:48:57 [Kevin Truyts] [reply
Bij de eerste veronderstelling is de studente naar de run-sequence plot gaan kijken om deze assumptie te beoordelen. Tijdens het college werd gezegd dat hiervoor naar de lag-plot moest worden gezien. Hiervoor diende de lag gelijk te stellen aan 12 of 36. Bij deze tijdreeks zien we dat de punten erg gespreid liggen op de grafiek en dat de autocorrelatie bijna gelijk is aan 0. Op de laatste grafiek zien we dat we hier te maken hebben met een seizonale correlatie/tijdreeks. Dit zien we aan het feit dat op de 12e en 24ste meting er zich telkens een piek voordoet die boven het 95%-betrouwbaarheidsinterval uitstijgt.
Conclusie: de tijdreeks is niet rondom wegens de seizonale autocorrelatie.
Tijdens de bespreking van de 2de assumptie werd er gezegd dat er slechts een kleine afwijking te zien is op het histogram en density-plot. Toch kunnen we dit beschouwen als een normaal verdeling en dit ondanks dat er geen autocorrelatie aanwezig is.
Voor de 3de assumptie moest er worden gezien naar de central tendency. Hier kunnen we het gemiddelde aflezen dat schommelt rond 87. Hierdoor kunnen we besluiten dat, als er outliers zijn, deze geen directe invloed hebben op de tijdreeks. Dit is ook (moeilijk) af te lezen op de run-sequence plot. Op lange termijn is het niveau niet constant en zien we zelfs een lichte achteruitgang.
Ook de 4de assumptie werd verkeerd beoordeeld. Hiervoor moest naar de run-sequence worden gezien. We bekijken dan de spreiding van de observaties. Hier onderscheiden we 2 delen. Deel 1 is groot en deel 2 is klein qua margeschommelingen.

Hieruit kunnen we besluiten dat het model niet voldoet aan de voorwaarden.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19651&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19651&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19651&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19651&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19651&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19651&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 12 ;
Parameters (R input):
par1 = 0 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')