Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationWed, 22 Oct 2008 08:37:05 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/22/t1224687069dw1yekbvr0iy2ec.htm/, Retrieved Sun, 19 May 2024 15:27:23 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18414, Retrieved Sun, 19 May 2024 15:27:23 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact715
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigating Dis...] [2007-10-21 18:26:46] [b9964c45117f7aac638ab9056d451faa]
F R PD    [Univariate Explorative Data Analysis] [Univariate EDA Q7...] [2008-10-22 14:37:05] [e08fee3874f3333d6b7a377a061b860d] [Current]
-   P       [Univariate Explorative Data Analysis] [Q7 Univariate exp...] [2008-11-02 14:15:44] [d134696a922d84037f02d49ded84b0bd]
- RMP       [Central Tendency] [] [2008-11-03 08:48:28] [f5709eefd05c649ca6dad46019ffd879]
Feedback Forum
2008-11-02 11:26:07 [Kevin Neelen] [reply
De eerste assumptie (fixed location) moet best op lange termijn bezien worden maar dit is niet echt mogelijk in de huidige grafiek. We kunnen enkel vermoeden dat er zich een dalende trend in de grafiek voordoet. Dit heeft echter niets met de verticale spreiding te maken zoals staat vermeld in bijgevoegd Word-document.
Bij de tweede assumptie (fixed variation)zien we dat er zich over de ganse lengte van de grafiek ongeveer eenzelfde verticale spreiding van de gegevens voordoet.
De derde assumptie (randomness) is er gekeken naar het lag-plot waarbij geconcludeerd werd dat er niet echt sprake is van randomness.
De laatste assumptie (fixed distribution) toont in het histrogram, densiity-plot en QQ-plot aan dat de grafiek een beetje rechts skewed is.
2008-11-02 11:34:05 [Kevin Neelen] [reply
Betreffende eventuele seizoensinvloeden, kan gesteld worden dat door het steeds terugkerende patroon van de grafiek, er waarschijnnlijk sprake kan zijn van bepaalde seizonsinvloeden.
2008-11-02 14:17:57 [Michaël De Kuyer] [reply
Vaste component: hier moet men kijken hoe het gemiddelde zich manifesteert op lange termijn. Uit de run sequence plot vermoed ik dat er een dalend verloop. Om een goede analyse te doen, zou men de gegevens kunnen analyseren via de mean plot.

Vaste variatie: Aan de hand van de run sequense plot kan ik vaststellen dat de gegevens in het eerste deel van de grafiek sterker schommelen dan in het tweede deel. Dit wijst erop dat er geen vaste variatie is.

Randomness: Er is inderdaad geen sprake van randomness. In de eerste lag plot (k=1)zou men dit eventueel nog kunnen vermoeden. Bij de tweede lag plot echter zien we duidelijk dat de puntenwolk zich rond de rechte bevinden. De autocorrelation function wijst er ook op dat er geen randomness is.

Vaste distributie: Het is inderdaad zodat de waarden naar links hellen. Dit is te zien op het histogram en density plot. Op basis van de QQ-plot zou ik toch durven te beweren dat de normaalverdeling wordt benaderd aangezien er een groot deel van de waarden op de rechte vallen.
2008-11-02 14:32:54 [Stijn Van de Velde] [reply
Allereerst had je beter de lag=36 genomen, dan kon je aan de hand van de autocorrelatie grafiek kijken of er sprake is van seizoenaliteit.
link: http://www.freestatistics.org/blog/date/2008/Nov/02/t12256353700k449xpl4d58n8a.htm

Assumptie 1:
Aan de hand van de run sequence plot zien we dat de grafiek op lange termijn toch constant blijft.
Je conclusie is dus niet juist, er is hier wel degelijk sprake van een fixed location. Aan deze voorwaarde is voldaan.


Assumptie 2:
Dit is wel juist. De variatie op de Y as lijkt steeds even groot.
Aan deze voorwaarde is dus ook voldaan.


Assumptie 3:
Met deze conclusie ben ik toch niet volledig akkoord. Het Q-Q plot voortoont weliswaar geen rechten, maar van een echte punten wolk kan men toch ook niet spreken.
Als we naar de autocorrelatie bij lag 36 kijken, zien we dat elk jaar zich het zelfde patroon herhaald. Er zijn heel wat pieken die buiten het 95% betrouwbaarheidsinterval (de stippel lijntjes) liggen, maar door hun wederkerend patroon kunnen deze door seizoenaliteit te verklaren zijn.
Toch denk ik niet dat je hier van randomness kunt spreken.
=> aan deze voorwaarde is volgens mij niet voldaan.


Assumptie 4:
Aan het histrogram is duidelijk te zien dat de gegevens hier niet symmetrisch verdeeld zijn.
=> aan deze voorwaarde is niet voldaan


Conclusie: er is hier geen sprake van 'tijdreeks = constante + random component'
  2008-11-02 20:56:57 [Yara Van Overstraeten] [reply
Ik ben het niet volledig eens met Stijn...

Assumptie 1
De student komt tot dezelfde conclusie, namelijk dat er sprake is van een fixed location, dus dit is hetzelfde dat jij (Stijn) bekomt.

Assumptie 2
Hier heb je inderdaad gelijk dat er sprake is van een fixed variation.

Assumptie 3:
De student komt hier net zoals Stijn tot dezelfde conclusie dat er geen sprake is van randomness.

Assumptie 4
De student komt ook tot de conclusie dat er geen sprake is van fixed distribution, net zoals Stijn.

Dus de student die de taak gemaakt heeft komt eigenlijk tot dezelfde conclusie als Stijn. Er is niet voldaan aan voorwaarde 3 en 4, dus je kan zeggen dat er hier geen sprake is van 'tijdreeks = constante + random component'!
2008-11-02 14:38:00 [Stijn Van de Velde] [reply
Q10:
Zoals ik bij Q7 al zei is er hier zeker sprake van seizoenaliteit. Elk jaar verloopt de run sequence plot volgens een zelfde patroon. Dit is ook duidelijk te zien bij de autocorrelatie wanneer we daarvoor lag=36 nemen.
2008-11-03 08:55:57 [Siem Van Opstal] [reply
Assumptie 1 (fixed location): Hierbij is het ook nuttig om naar de lag plot te kijken. Als het wolkenveld dicht rond de rechte ligt is er sprake van correlatie maar dat is bij deze gegevens niet echt het geval.

Assumptie 2 (fixed distribution): Om te zien of er een normaalverdeling is kijken we best naar het histogram. Daarop zien we links en rechts een uitschieters. Buiten deze uitschieters gerekend zouden we kunnen spreken van een normaalverdeling. Ook via de Normal Q-Q Plot kunnen we dat aflezen. De rechte stelt de theoretische kwantielen voor die je zou hebben bij een perfecte normaalverdeling. Je merkt dat de werkelijke kwantielen in het midden dicht bij die rechte liggen. Aan de uiteinden liggen ze er wat verder vandaag, dat wijst op die uitschieters.

Assumptie 3 (fixed location): Om constant te zijn zou de run sequence plot niet mogen fluctueren en er zitten wel veel schommelingen in. We kunnen ook controleren of het gemiddelde constant is, dat doe je door de gegevens te reproduceren in de central tendency module. http://www.freestatistics.org/blog/date/2008/Nov/03/t1225702153i03d7cm8qygy5lj.htm. Het gemiddelde lijkt niet erg constant en daalt op het einde

Assumptie 4 (fixed variation): juiste conclusie
2008-11-04 08:56:50 [Michael Van Spaandonck] [reply
Assumptiebespreking

Er is een fixed location. Run sequence plot verloopt vlak.
Er is een fixed variation: de verticale spreiding is overal ongeveer gelijk.
Geen willekeurige verdeling op basis van autocorrelation.
Geen fixed distribution want het histogram vertoont een helling naar links.

Algemene conclusie: er wordt niet aan assumpties 3 en 4 voldaan, dus het model “Aantal inschr. nieuwe wagens = constant + random component” is geen geldig model.
2008-11-04 08:57:13 [Michael Van Spaandonck] [reply
Assumptiebespreking

Er is een fixed location. Run sequence plot verloopt vlak.
Er is een fixed variation: de verticale spreiding is overal ongeveer gelijk.
Geen willekeurige verdeling op basis van autocorrelation.
Geen fixed distribution want het histogram vertoont een helling naar links.

Algemene conclusie: er wordt niet aan assumpties 3 en 4 voldaan, dus het model “Aantal inschr. nieuwe wagens = constant + random component” is geen geldig model.
2008-11-04 08:59:44 [Michael Van Spaandonck] [reply
Op basis van een vast wederkerend patroon een seizoenaliteit. Juist.
2008-11-04 09:01:28 [Michael Van Spaandonck] [reply
Assumptiebespreking

Er is een fixed location. Run sequence plot verloopt vlak.
Er is een fixed variation: de verticale spreiding is overal ongeveer gelijk.
Geen willekeurige verdeling op basis van autocorrelation.
Geen fixed distribution want het histogram vertoont een helling naar links.

Algemene conclusie: er wordt niet aan assumpties 3 en 4 voldaan, dus het model “Aantal inschr. nieuwe wagens = constant + random component” is geen geldig model.

Post a new message
Dataseries X:
58.972
59.249
63.955
53.785
52.760
44.795
37.348
32.370
32.717
40.974
33.591
21.124
58.608
46.865
51.378
46.235
47.206
45.382
41.227
33.795
31.295
42.625
33.625
21.538
56.421
53.152
53.536
52.408
41.454
38.271
35.306
26.414
31.917
38.030
27.534
18.387
50.556
43.901
48.572
43.899
37.532
40.357
35.489
29.027
34.485
42.598
30.306
26.451
47.460
50.104
61.465
53.726
39.477
43.895
31.481
29.896
33.842
39.120
33.702
25.094




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18414&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18414&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18414&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations60
minimum18.387
Q133.3725
median40.6655
mean40.9447333333333
Q348.955
maximum63.955

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 60 \tabularnewline
minimum & 18.387 \tabularnewline
Q1 & 33.3725 \tabularnewline
median & 40.6655 \tabularnewline
mean & 40.9447333333333 \tabularnewline
Q3 & 48.955 \tabularnewline
maximum & 63.955 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18414&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]60[/C][/ROW]
[ROW][C]minimum[/C][C]18.387[/C][/ROW]
[ROW][C]Q1[/C][C]33.3725[/C][/ROW]
[ROW][C]median[/C][C]40.6655[/C][/ROW]
[ROW][C]mean[/C][C]40.9447333333333[/C][/ROW]
[ROW][C]Q3[/C][C]48.955[/C][/ROW]
[ROW][C]maximum[/C][C]63.955[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18414&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18414&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations60
minimum18.387
Q133.3725
median40.6655
mean40.9447333333333
Q348.955
maximum63.955



Parameters (Session):
par1 = 0 ; par2 = 12 ;
Parameters (R input):
par1 = 0 ; par2 = 12 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')