Free Statistics

of Irreproducible Research!

Author's title

Indexcijfers van de consumptieprijzen per groep van producten: transport , ...

Author

*Unverified author*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Mon, 27 Oct 2008 14:22:28 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225139124wpo4hcgcmqxo1ou.htm/, Retrieved Sun, 19 May 2024 14:44:50 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19578, Retrieved Sun, 19 May 2024 14:44:50 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

168

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigating dis...] [2007-10-22 19:45:25] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Indexcijfers van ...] [2008-10-27 20:22:28] [84a986a411c52e49a8807521f8b9f7a0] [Current]
- R PD      [Univariate Explorative Data Analysis] [Q7] [2008-10-30 17:48:46] [491a70d26f8c977398d8a0c1c87d3dd4] 
- RMPD      [Central Tendency] [Q7] [2008-10-30 18:03:57] [491a70d26f8c977398d8a0c1c87d3dd4] 
-   PD      [Univariate Explorative Data Analysis] [Investigating Dis...] [2008-10-31 20:39:32] [82970caad4b026be9dd352fdec547fe4] 
-   PD      [Univariate Explorative Data Analysis] [Q7 Univariate exp...] [2008-11-01 15:03:21] [d134696a922d84037f02d49ded84b0bd] 
- RMP         [Central Tendency] [Investigating dis...] [2008-11-02 14:42:57] [b943bd7078334192ff8343563ee31113] 

Feedback Forum

2008-10-31 21:07:36 [Ruben Jacobs] [reply] 
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/31/t1225486030kjism7no67cdovj.htm 
 
Assumptie 1: Er is wel duidelijk autocorrelatie te zien. Volgens het handboek kan je dan besluiten dat het model komt van een onderliggend autoregressief model met een sterke positieve correlatie. 
 
Assumptie 2: Juiste interpratie, er is inderdaad geen normaalverdeling. 
 
Assumptie 3: Hiervoor moet de central tendency constant zijn. Je kan best central tendency berekenen van je tijdreeks. Als deze grafiek constant blijft, is aan deze assumptie voldaan. 
 
Assumptie 4: De spreiding is duidelijk niet constant. Als je de eerste helft van het Run Sequence Plot vergelijkt met de tweede helft, kan je zien dat de spreiding in de tweede helft duidelijk veel groter is. 
 
Besluit: er is niet aan alle voorwaarden voldaan dus dit is geen geldig model.
2008-11-01 15:06:13 [Stijn Van de Velde] [reply] 
Ook hier had je de lag op 36 moeten zetten. 
link: http://www.freestatistics.org/blog/date/2008/Nov/01/t1225551841d7da20snj6y9f20.htm 
 
Vervolgens moeten we de 4 voorwaarden onderzoeken: 
 
1. random drawings; 
2. from a fixed distribution; 
3. with the distribution having fixed location; and 
4. with the distribution having fixed variation. 
 
1)Kijken naar de autocorrelatie grafiek. 
Hier zijn duidelijk enkel pieken, die helemaal niets met seizoensgebondenheid te maken hebben. De autocorrelatie ligt in het begin dus zeker niet dicht bij 0, wat er op duid dat er geen randomness is. 
De lagplot grafieke vormen ook geen punten wolk, dus ook hier geen randomness. 
 
=> aan deze voorwaarde is niet voldaan. Het heeft dus in princiepe geen zin om de andere 3 nog te onderzoeken. 
 
2)Het Q-Q plot ligt zeker niet op 1 rechte. 
 
=>er is dus zeker geen fixed distribution. 
 
dit word bevestigd door het histogram en het density-plot. 
 
3) De run sequence plot kent een duidelijk stijgend verloop. 
 
=> ook aan deze voorwaarde is niet voldaan. 
 
4) Ook de groote van de fluctuatie op de y as is niet gelijk. 
 
=> voorwaarde niet voldaan. 
 
conclusie: 
 
Er is hier zeker geen sprake van Tijdreeks = Constante + random component.
2008-11-01 15:26:45 [Stijn Van de Velde] [reply] 
Q10: http://www.freestatistics.org/blog/date/2008/Nov/01/t1225551841d7da20snj6y9f20.htm  
 
deze auto correlatie grafiek laat zien dat er inderdaad geen seizoensgebondenheid is.
2008-11-02 14:45:04 [Ciska Tanghe] [reply] 
Q7 
 
Assumptie 1: wanneer we naar de lag-plot grafiek kijken, zien we heel duidelijk een puntenwolk waaruit volgt dat de gegevens random zijn. Kijken we naar de autocorrelatie, dan zien we geen pieken, waardoor we kunnen besluiten dat er geen autocorrelatie is. 
 
Assumptie 2: zowel op het histogram als op de density plot zien we dat er helemaal geen gelijke verdeling is van de datareeks. 
 
Assumptie 3: kijken we naar de Run Sequence Plot, dan zien we heel duidelijk dat deze een stijgend verloop kent. Je kan ook gebruik maken van Central Tendency. Deze zou dus constant moeten zijn om aan de voorwaarde te voldoen, maar dit is niet het geval.  
 
http://www.freestatistics.org/blog/date/2008/Nov/02/t1225637029ln5btwky9trt80x.htm 
 
Assumptie 4: de spreiding is helemaal niet gelijk. Op de rechterhelft van de grafiek is deze groter dan op de linkerhelft. 
 
Hieruit volgt dat dit model niet voldoet aan alle voorwaarden. 
 
Assumptie 4: 
2008-11-03 18:29:42 [9142cf052ad32d043faa9486189092cf] [reply] 
De student heeft voor assumptie 1 gekeken naar de Run sequence plot. Dit is in de praktijk wel mogelijk maar is in de lessen nog niet besproken. Andere methode 
 
Voor Assumptie 1: Aflezen op de lag plot 
Hoe bekom je deze grafieken  
lags (autocorrelation function) (?) invullen 12 (1jaar) of 36 voor 3 jaren.  
Waarom is dit niet automatisch ingevuld: Lags enkel gebruiken voor tijdreeksen. 
Link met juiste oplossing			 
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Oct/30/t12253890677z7nrqx9d9b6683.htm , Retrieved Thu, 30 Oct 2008 17:51:18 +0000 
De lag plots gaan het verband vast leggen tussen heden en verleden 
Bij de lag plot k=1: punten liggen verspreid rond de rechte lijn ( autocorrelatie (maatstaf die aangeeft hoe dicht de punten op een rechte liggen)---> bijna nul) Het is hier ook moeilijk om uitspraak te doen over de toekomst 
Bij lag plot k=36: samenvatting lag plot 3 jaar: De punten liggen hier veel ver van de lijn 
 
Voor assumptie 2 
 
Goede conclusie. De student heeft de conclusie gevormd met behulp van de density plot en aan de hand van het histogram. 
 
Voor assumptie 3 
 
Om een conclusie te vormen bij het derde puntje heeft de student gekeken naar de normal Q-Q plot. Aan de hand van deze grafiek is het moeilijk om een juiste conclusie te vormen. Je kan hier het best een conclusie vormen aan de hand van de central tendensy. 
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Oct/30/t1225389885wll2qtbahr6flkd.htm, Retrieved Thu, 30 Oct 2008 18:04:59 +0000 
We hebben een gemiddelde van 122, We kunnen zien dat het gemiddelde en de mediaan dicht bij mekaar liggen maar dat er toch enkele outliers aanwezig zijn dit kunnen we aflezen op de mid range.  
Conclusie: We kunnen zien dat er op LT een stijgende trend is. 
 
Assumptie 4: 
De student heeft dit deeltje niet opgelost. 
Hiervoor moet je kijken naar de Run sequence plot. Als je de grafiek in twee delen splits dan zie je dat de spreiding in deel 2 groter is dan de spreiding in deel 1. Dus deel 2 schommelt harder als deel 1. Er is geen gelijkheid te bespeuren. 
 
2008-11-03 21:01:49 [Chi-Kwong Man] [reply] 
Bij de eerste assumptie is het in principe wel mogelijk om naar de Run Sequence Plot te kijken, maar dit is niet in de les besproken (komt later nog aan bod). Voor de andere assumpties verwijs ik naar vraag Q2. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19578&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19578&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19578&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Descriptive Statistics
# observations	60
minimum	112.75
Q1	117.8875
median	121.08
mean	126.997666666667
Q3	132.2925
maximum	164.85

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 60 \tabularnewline
minimum & 112.75 \tabularnewline
Q1 & 117.8875 \tabularnewline
median & 121.08 \tabularnewline
mean & 126.997666666667 \tabularnewline
Q3 & 132.2925 \tabularnewline
maximum & 164.85 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19578&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]60[/C][/ROW]
[ROW][C]minimum[/C][C]112.75[/C][/ROW]
[ROW][C]Q1[/C][C]117.8875[/C][/ROW]
[ROW][C]median[/C][C]121.08[/C][/ROW]
[ROW][C]mean[/C][C]126.997666666667[/C][/ROW]
[ROW][C]Q3[/C][C]132.2925[/C][/ROW]
[ROW][C]maximum[/C][C]164.85[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19578&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19578&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	60
minimum	112.75
Q1	117.8875
median	121.08
mean	126.997666666667
Q3	132.2925
maximum	164.85

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 0 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Indexcijfers van de consumptieprijzen per groep van producten: transport , ...

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code