Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationThu, 23 Oct 2008 05:06:23 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224760184nfta4sdf4dw3jkp.htm/, Retrieved Sun, 19 May 2024 12:57:26 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18461, Retrieved Sun, 19 May 2024 12:57:26 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact206
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Univariate Explorative Data Analysis] [Q2 Univariate EDA] [2008-10-23 11:06:23] [d96f761aa3e94002e7c05c3c847d2c79] [Current]
-   P     [Univariate Explorative Data Analysis] [Task 2] [2008-10-24 10:02:58] [76963dc1903f0f612b6153510a3818cf]
-   P       [Univariate Explorative Data Analysis] [Task 2] [2008-10-24 10:06:29] [76963dc1903f0f612b6153510a3818cf]
-             [Univariate Explorative Data Analysis] [] [2008-11-03 15:57:50] [888addc516c3b812dd7be4bd54caa358]
F   PD      [Univariate Explorative Data Analysis] [Q7 Univariate EDA] [2008-10-24 10:12:47] [76963dc1903f0f612b6153510a3818cf]
F RMP         [Tukey lambda PPCC Plot] [Q8 Tuky Lambda PP...] [2008-10-24 10:19:58] [76963dc1903f0f612b6153510a3818cf]
-               [Tukey lambda PPCC Plot] [] [2008-11-03 16:29:28] [888addc516c3b812dd7be4bd54caa358]
-   P         [Univariate Explorative Data Analysis] [Verbetering Q10] [2008-11-03 08:58:31] [76963dc1903f0f612b6153510a3818cf]
- R P         [Univariate Explorative Data Analysis] [Verbetering Q7] [2008-11-03 09:29:58] [7458e879e85b911182071700fff19fbd]
- R P         [Univariate Explorative Data Analysis] [Verbetering Q7] [2008-11-03 09:29:58] [7458e879e85b911182071700fff19fbd]
- R             [Univariate Explorative Data Analysis] [Verbetering Q7 As...] [2008-11-03 10:33:50] [7458e879e85b911182071700fff19fbd]
-             [Univariate Explorative Data Analysis] [] [2008-11-03 16:25:36] [888addc516c3b812dd7be4bd54caa358]
- R P     [Univariate Explorative Data Analysis] [Verbetering Q2] [2008-11-01 17:38:31] [7458e879e85b911182071700fff19fbd]
Feedback Forum
2008-10-30 20:10:35 [Kim De Vos] [reply
Assumptie 1: Hierbij moet je kijken naar de autocorrelatie op de lag-plot. Bij opties moet je de hoeveelheid vertragingen ingeven die moeten worden berekend. Dit geeft je de mogenlijkheid om een toekomstige voorspelling te doen.
De tijdreeks is niet random maar er is sprake van positieve seizonale autocorrelatie. Je ziet dat in lag 12 en 24 de lag boven de grens ligt. (Dit is een terugkerend patroon in maand 12 van elk jaar)

Assumptie 2: Om te bepalen of je data normaal verdeeld is, kan je gebruik maken van de density plot en het histogram maar ook via de normal Q-Q plot. Op het histogram en de density plot kan je niet duidelijk waarnemen of het hier gaat om een normale verdeling. De Q-Q plot geeft duidelijke informatie. Hier merk je op dat de waarnemeingen vrij dicht op de rechte liggen. Toch merk je een oneffenheid op maar hier moet je niet wakker van liggen want deze ligt vrij dicht tegen de rechte.

Assumptie 3:
De grafiek mag niet fluctueren op lange termijn.
Je kan hiervoor kijken naar de run sequence plot, je merkt een dalende trend op.
Je kan dit ook op een andere manier berekenen, namelijk door de central tendency uit te voeren.
http://www.freestatistics.org/blog/date/2008/Oct/30/t1225396256z7cpi8rqy2wptn0.htm

Je ziet in de tabel dat de gemiddelden rond 87 schommelen, de outliers hebben dus niet echt effect op het gemiddelde. Toch blijft dit echter moeilijk te zien, we vermoeden dat er een dalende trend is.

Assumptie 4:
Gebruikte techniek = Sequence plot. Hier moet je kijken naar de spreiding van de reeks over de tijd heen. Je verdeelt de grafiek in 2 gelijke delen. In het 1e deel schommelt de grafiek meer dan in het 2e deel, ze hebben dus niet dezelfde spreiding.

Er werd niet voldaan aan de 4 validiteisvoorwaarden.
2008-11-02 12:16:26 [Jef Keersmaekers] [reply
http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/01/t1225561280yoj9xt5avkrr5h3.htm

Assumptie 1:
Hiervoor heeft de student zijn bevindingen afgelezen van een verkeerde grafiek ipv de Run Sequence plot te gebruiken had de student de Lagplot moeten gebruiken. Uit het lagplot kunnen we opmaken dat er positieve correlatie is.

Assumptie 2:
Assumptie 2 is correct, er is inderdaad een mooie density plot waar te nemen waar toch enkele outliers zichtbaar zijn maar waar we niet van wakker moeten liggen.

Assumptie 3:
Assumption 3 kunnen we aflezen aan de hand van de Run Sequence Plot. Deze grafiek mag niet fluctueren op lange termijn.

Assumption 4
Assumption 4 lezen we tevens af op het Run Sequence Plot, hierbij kijken we naar hoe groot de spreiding is. We delen de grafiek in de helft door 2 en dan worden de 2 delen tov elkaar vegeleken, hieruit kunnen we uitmaken dat er een grotere spreiding is in het eerste deel.
2008-11-03 08:47:15 [339a57d8a4d5d113e4804fc423e4a59e] [reply
De student heeft enkele foutjes gemaakt in zijn berekening. Men moet het aantal lags instellen en best in 12,24 of 36.

Ass 1:
De student probeert deze assumptie te staven via de Run Suquence plot, maar dit is niet correct. Men moet deze assumptie controleren door naar de lagplot te kijken. Op de lagplot kan men zien dat elk punt onafhankelijk is van elkaar en dat er dus sprake is van autocorrelatie.

Ass 2:
Op de densityplot kan men zien dat deze mooi bellshaped is. We merken wel op dat er weliswaar een kleine deuk in zit. Wanneer we kijken op het histogram, zien we dat deze deuk te verklaren is door het redelijk hoge aantal in de tweede klasse. Dit verandert echter niets aan de spreiding. We kunnen hier spreken van een normaalverdeling.

Ass 3:
Er is hier geen 'fixed location', men ziet een lichte daling op de Run Sequence Plot. Deze daling is echter een vermoeden en is niet uitgesproken.

Ass 4:
Deze is in tegenstelling tot wat de student denkt, wel mogelijk. Hiervoor kijkt men naar spreiding van de random component. Op de Run Sequence plot deelt men de grafiek als het ware in twee. men kan zien dat de grafiek in het tweede deel meer schommelt dan in het eerste deel. De spreiding van de random component is dus gelijk.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18461&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18461&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18461&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18461&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18461&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18461&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')