Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 11:01:51 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t12251269600wd8dgx53hv2l95.htm/, Retrieved Sun, 19 May 2024 14:10:53 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19265, Retrieved Sun, 19 May 2024 14:10:53 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact163
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [] [2008-10-27 17:01:51] [7ed4ec9f8cdf7df79ef87b9dc09dff20] [Current]
-   P       [Univariate Explorative Data Analysis] [] [2008-11-01 12:12:56] [4c8dfb519edec2da3492d7e6be9a5685]
Feedback Forum
2008-11-01 12:19:35 [2df1bcd103d52957f4a39bd4617794c8] [reply
Het model dient te worden getoetst aan 4 voorwaarden om na te gaan of het al dan niet voldoet.

Assumptie1: autocorrelatie?
Assumptie2: vaste verdeling?
Assumptie3: constante locatie
Assumptie4: zelfde spreiding doorheen tijd?


Ass1: De student had beter de lags in zijn berekening aangepast naar 36 om zo de lagplot en of autocorrelatie functie te bekijken.

Ik heb de berekening gereproduceerd

http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/01/t1225541612atl5u5ueu1ofee5.htm

Op de lagplot grafiek merken we duidelijk dat er geen correlatie is aangezien de punten op de grafiek ver van de rechte liggen verwijderd.


Ass2: We bekijken het Histogram of densety plot. We stellen een normaalverdeling vast op de grafieken.
Wanneer we het QQ plot bekijken kunnen we dezelfde conclusie trekken. Op de yas worden hier de quantiles weergegeven en op de x as de theoretische quantilen bij een perfecte normaalverdeling.


Ass3: We stellen op lange termijn een lichte daling van de gegevens vast. Er is dus geen sprake van een constante locatie. Hiervoor keken we naar het run sequence plot.


Ass4: Er is geen vast patroon waar te nemen in de spreiding doorheen de tijd.


Het model voldoet dus niet aan alle voorwaarden.
2008-11-03 20:07:19 [Chi-Kwong Man] [reply
1ste assumptie: random drawings?
Dit kan men zien aan de lagplots, welke niet te zien is op jouw blog, dus die moest je bij de computatie nog invullen (12 of 36). In tegenstelling tot jouw conclusie is er dus wel seizoenaliteit aanwezig.

2de assumptie: fixed distribution? Deze veronderstelling wordt inderdaad bekeken op de 2de en 3de grafiek. De kleine afwijking is niet erg en lijkt dus op een normaalverdeling.

3de assumptie: has the distribution a fixed location. Hier moet men niet naar de QQ-plot kijken, maar naar de run sequence plot. Er is een daling als men ziet naar de eerste grafiek, dus geen constante, maar moeilijk te zien, dus moeten we een andere methode gebruiken. Centrale tendens. Hier moet men naar de trimmed mean kijken, de grafiek verloopt redelijk constant lijkt, wat dus betekent dat de tijdreeks ook vrij constant is.

Assumptie 4 ontbreekt hier nog.
Assumptie 4: has the distribution a fixed variation
Deze kan je vinden op de run sequence plot grafiek. Deze moet je in 2 hakken: in het linkergedeelte kan men zien dat de spreiding van de Y-as groter is als het rechtergedeelte. M.a.w. geen vaste variatie.

Het model voldoet dus niet aan alle 4 voorwaarden, dus niet geschikt.
2008-11-03 23:04:07 [Martjin De Swert] [reply
Voor de eerste assumptie moest de student de lag op 36 brengen om zo de lagplot beter te bestuderen. Dan had duidelijk geworden dat er wel degelijk sprake was van seizonaliteit.

Voor de 2de assumptie kunnen we concluderen dat we vrij dicht bij de normaalverdeling zitten ondanks dat er geen autocorrelatie is.

over assumptie 3 valt geen uitspraak te doen omdat dit niet duidelijk af te lezen is op de grafief.

We kunnen dus concluderen dat het model niet voldoet aan alle voorwaarden dus niet geldig is.


Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19265&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19265&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19265&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19265&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19265&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19265&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')