Free Statistics

of Irreproducible Research!

Author's title

Indexcijfers van de consumptieprijzen per groep van producten: transport , ...

Author*Unverified author*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 14:22:28 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225139124wpo4hcgcmqxo1ou.htm/, Retrieved Sun, 19 May 2024 14:44:50 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19578, Retrieved Sun, 19 May 2024 14:44:50 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact168
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigating dis...] [2007-10-22 19:45:25] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Indexcijfers van ...] [2008-10-27 20:22:28] [84a986a411c52e49a8807521f8b9f7a0] [Current]
- R PD      [Univariate Explorative Data Analysis] [Q7] [2008-10-30 17:48:46] [491a70d26f8c977398d8a0c1c87d3dd4]
- RMPD      [Central Tendency] [Q7] [2008-10-30 18:03:57] [491a70d26f8c977398d8a0c1c87d3dd4]
-   PD      [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-10-31 20:39:32] [82970caad4b026be9dd352fdec547fe4]
-   PD      [Univariate Explorative Data Analysis] [Q7 Univariate exp...] [2008-11-01 15:03:21] [d134696a922d84037f02d49ded84b0bd]
- RMP         [Central Tendency] [Investigating dis...] [2008-11-02 14:42:57] [b943bd7078334192ff8343563ee31113]
Feedback Forum
2008-10-31 21:07:36 [Ruben Jacobs] [reply
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/31/t1225486030kjism7no67cdovj.htm

Assumptie 1: Er is wel duidelijk autocorrelatie te zien. Volgens het handboek kan je dan besluiten dat het model komt van een onderliggend autoregressief model met een sterke positieve correlatie.

Assumptie 2: Juiste interpratie, er is inderdaad geen normaalverdeling.

Assumptie 3: Hiervoor moet de central tendency constant zijn. Je kan best central tendency berekenen van je tijdreeks. Als deze grafiek constant blijft, is aan deze assumptie voldaan.

Assumptie 4: De spreiding is duidelijk niet constant. Als je de eerste helft van het Run Sequence Plot vergelijkt met de tweede helft, kan je zien dat de spreiding in de tweede helft duidelijk veel groter is.

Besluit: er is niet aan alle voorwaarden voldaan dus dit is geen geldig model.
2008-11-01 15:06:13 [Stijn Van de Velde] [reply
Ook hier had je de lag op 36 moeten zetten.
link: http://www.freestatistics.org/blog/date/2008/Nov/01/t1225551841d7da20snj6y9f20.htm

Vervolgens moeten we de 4 voorwaarden onderzoeken:

1. random drawings;
2. from a fixed distribution;
3. with the distribution having fixed location; and
4. with the distribution having fixed variation.

1)Kijken naar de autocorrelatie grafiek.
Hier zijn duidelijk enkel pieken, die helemaal niets met seizoensgebondenheid te maken hebben. De autocorrelatie ligt in het begin dus zeker niet dicht bij 0, wat er op duid dat er geen randomness is.
De lagplot grafieke vormen ook geen punten wolk, dus ook hier geen randomness.

=> aan deze voorwaarde is niet voldaan. Het heeft dus in princiepe geen zin om de andere 3 nog te onderzoeken.

2)Het Q-Q plot ligt zeker niet op 1 rechte.

=>er is dus zeker geen fixed distribution.

dit word bevestigd door het histogram en het density-plot.

3) De run sequence plot kent een duidelijk stijgend verloop.

=> ook aan deze voorwaarde is niet voldaan.

4) Ook de groote van de fluctuatie op de y as is niet gelijk.

=> voorwaarde niet voldaan.

conclusie:

Er is hier zeker geen sprake van Tijdreeks = Constante + random component.
2008-11-01 15:26:45 [Stijn Van de Velde] [reply
Q10: http://www.freestatistics.org/blog/date/2008/Nov/01/t1225551841d7da20snj6y9f20.htm

deze auto correlatie grafiek laat zien dat er inderdaad geen seizoensgebondenheid is.
2008-11-02 14:45:04 [Ciska Tanghe] [reply
Q7

Assumptie 1: wanneer we naar de lag-plot grafiek kijken, zien we heel duidelijk een puntenwolk waaruit volgt dat de gegevens random zijn. Kijken we naar de autocorrelatie, dan zien we geen pieken, waardoor we kunnen besluiten dat er geen autocorrelatie is.

Assumptie 2: zowel op het histogram als op de density plot zien we dat er helemaal geen gelijke verdeling is van de datareeks.

Assumptie 3: kijken we naar de Run Sequence Plot, dan zien we heel duidelijk dat deze een stijgend verloop kent. Je kan ook gebruik maken van Central Tendency. Deze zou dus constant moeten zijn om aan de voorwaarde te voldoen, maar dit is niet het geval.

http://www.freestatistics.org/blog/date/2008/Nov/02/t1225637029ln5btwky9trt80x.htm

Assumptie 4: de spreiding is helemaal niet gelijk. Op de rechterhelft van de grafiek is deze groter dan op de linkerhelft.

Hieruit volgt dat dit model niet voldoet aan alle voorwaarden.

Assumptie 4:
2008-11-03 18:29:42 [9142cf052ad32d043faa9486189092cf] [reply
De student heeft voor assumptie 1 gekeken naar de Run sequence plot. Dit is in de praktijk wel mogelijk maar is in de lessen nog niet besproken. Andere methode

Voor Assumptie 1: Aflezen op de lag plot
Hoe bekom je deze grafieken
lags (autocorrelation function) (?) invullen 12 (1jaar) of 36 voor 3 jaren.
Waarom is dit niet automatisch ingevuld: Lags enkel gebruiken voor tijdreeksen.
Link met juiste oplossing
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Oct/30/t12253890677z7nrqx9d9b6683.htm , Retrieved Thu, 30 Oct 2008 17:51:18 +0000
De lag plots gaan het verband vast leggen tussen heden en verleden
Bij de lag plot k=1: punten liggen verspreid rond de rechte lijn ( autocorrelatie (maatstaf die aangeeft hoe dicht de punten op een rechte liggen)---> bijna nul) Het is hier ook moeilijk om uitspraak te doen over de toekomst
Bij lag plot k=36: samenvatting lag plot 3 jaar: De punten liggen hier veel ver van de lijn

Voor assumptie 2

Goede conclusie. De student heeft de conclusie gevormd met behulp van de density plot en aan de hand van het histogram.

Voor assumptie 3

Om een conclusie te vormen bij het derde puntje heeft de student gekeken naar de normal Q-Q plot. Aan de hand van deze grafiek is het moeilijk om een juiste conclusie te vormen. Je kan hier het best een conclusie vormen aan de hand van de central tendensy.
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Oct/30/t1225389885wll2qtbahr6flkd.htm, Retrieved Thu, 30 Oct 2008 18:04:59 +0000
We hebben een gemiddelde van 122, We kunnen zien dat het gemiddelde en de mediaan dicht bij mekaar liggen maar dat er toch enkele outliers aanwezig zijn dit kunnen we aflezen op de mid range.
Conclusie: We kunnen zien dat er op LT een stijgende trend is.

Assumptie 4:
De student heeft dit deeltje niet opgelost.
Hiervoor moet je kijken naar de Run sequence plot. Als je de grafiek in twee delen splits dan zie je dat de spreiding in deel 2 groter is dan de spreiding in deel 1. Dus deel 2 schommelt harder als deel 1. Er is geen gelijkheid te bespeuren.

2008-11-03 21:01:49 [Chi-Kwong Man] [reply
Bij de eerste assumptie is het in principe wel mogelijk om naar de Run Sequence Plot te kijken, maar dit is niet in de les besproken (komt later nog aan bod). Voor de andere assumpties verwijs ik naar vraag Q2.

Post a new message
Dataseries X:
118,63
121,83
119,97
124,98
129,99
126,60
121,71
119,28
122,63
116,74
114,23
113,23
112,75
113,54
115,30
121,05
119,51
116,78
117,17
117,50
119,65
120,97
117,18
116,87
119,46
122,52
124,10
118,39
113,10
113,94
114,58
118,79
120,44
118,37
118,44
117,93
117,76
118,29
121,11
124,86
131,17
130,16
131,76
134,70
135,32
140,23
136,31
131,62
128,90
133,89
138,21
146,12
144,69
149,18
156,60
158,87
164,85
162,89
153,31
150,91




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19578&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19578&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19578&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations60
minimum112.75
Q1117.8875
median121.08
mean126.997666666667
Q3132.2925
maximum164.85

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 60 \tabularnewline
minimum & 112.75 \tabularnewline
Q1 & 117.8875 \tabularnewline
median & 121.08 \tabularnewline
mean & 126.997666666667 \tabularnewline
Q3 & 132.2925 \tabularnewline
maximum & 164.85 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19578&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]60[/C][/ROW]
[ROW][C]minimum[/C][C]112.75[/C][/ROW]
[ROW][C]Q1[/C][C]117.8875[/C][/ROW]
[ROW][C]median[/C][C]121.08[/C][/ROW]
[ROW][C]mean[/C][C]126.997666666667[/C][/ROW]
[ROW][C]Q3[/C][C]132.2925[/C][/ROW]
[ROW][C]maximum[/C][C]164.85[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19578&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19578&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations60
minimum112.75
Q1117.8875
median121.08
mean126.997666666667
Q3132.2925
maximum164.85



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')