Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationThu, 23 Oct 2008 06:52:00 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224766362h2tpbjzny7dd02t.htm/, Retrieved Sun, 19 May 2024 14:33:25 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18500, Retrieved Sun, 19 May 2024 14:33:25 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact211
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Tukey lambda PPCC Plot] [Investigating Dis...] [2007-10-21 16:01:20] [b9964c45117f7aac638ab9056d451faa]
F RMPD    [Univariate Explorative Data Analysis] [Q2 unvariate EDA] [2008-10-23 12:52:00] [46b5932fe641d17912b9bed340844588] [Current]
-   P       [Univariate Explorative Data Analysis] [Herberekening] [2008-11-02 13:32:47] [79c17183721a40a589db5f9f561947d8]
Feedback Forum
2008-11-02 13:30:44 [Steven Hulsmans] [reply
2008-11-02 13:41:31 [Steven Hulsmans] [reply
Bij de eerste assumptie moeten we niet kijken naar de eerste grafiek, maar naar de 'lag ploat' Deze wordt hier echter niet weergegeven, aangezien het aantal lags te laag werd ingesteld. Het zou beter geweest zijn om dit in te stellen op 12 of 36, zodat we de grafiek van de autocorrelatie ook konden bestuderen. Hierop zouden we zien dat de punten gespreid liggen rond de lijn, waardoor de autocorrelatie bijna 0 wordt: http://www.freestatistics.org/blog/date/2008/Nov/02/t1225632830qvp13zj18skrbvm.htm
De tijdreeks is niet echt random. Ze bevat autocorrelatie met seizoenale betekening.
Voor assumptie 2 zien we inderdaad op de density plot dat de gegevens niet gelijk verdeeld zijn aan beide kanten, we zien links een bult maar dit is geen ramp. We hebben bijgevolg geen enkele reden om aan te nemen dat er geen normaalverdeling is.
Voor assumptie 3 kijken we naar de run sequence plot. Deze mag niet fluctueren op lange termijn. We merken echter op dat de reeks snel op en neer gaat. Er is dus een achteruitgang op lange termijn. De reeks is bijgevolg niet constant.
Bij assumptie 4 gingen we nagaan of er een vaste spreiding was. In de run sequence plot zien we dat de spreiding over het eerste deel groter is dan bij het tweede deel. Er is dus een verandering in de tijd.
2008-11-03 09:55:16 [Lindsay Heyndrickx] [reply
nr1: Dit moet met autocorrelatie of met de lagplot. Niet met run sequence plot. Aantal lags is hier 12 of 36 want je werkt hier met een tijdreeks (als het geen tijdreeks is geen lags ingeven.) Hier is een seizonale correlatie.=>. De tijdreeks is hier dus niet random want ze bevat autocorrelatie met seizonale betekenis.
nr 2: Dit moet je afleiden uit het histogram en het density plot. De tweede balk steekt er een beetje uit en er is een kleine knik in de density plot maar dit is niet erg uitgesproken dus kan dit normaal gezien geen effect hebben op de normaal verdeling.
Je kan dit ook testen met het qqplot hier zien we dat de punten ongeveer allemaal dicht op de lijn liggen dus dit wijst hier ook op een normaal verdeling.
Er is dus een normaal verdeling ondanks dat er correlatie is.
De student heeft de gegevens hier dus fout geïnterpreteerd.
nr 3: Hier heeft de student naar de verkeerde grafiek gekeken. Hier moet je de run sequence plot gebruiken. Als je wilt kijken of het gemiddelde constant is moet je de central tendancy toepassen. Het gemiddelde is hier ongeveer constant. Het schommelt een beetje rond de 87. Outliers hebben hier geen invloed op. Er wordt vermoed dat er een dalende trend is maar dit is op lange termijn zeer moeilijk te zeggen.
nr 4: Hier moet je de run sequence plot gebruiken. Je moet hier naar de spreiding van de reeks kijken over de tijd heen. In het eerste deel zijn de observaties hier meer gespreid door de tijd heen is er een verandering in marges. Hier is dus een verandering in tijd in de spreiding.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18500&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18500&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18500&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18500&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18500&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18500&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')