Free Statistics

of Irreproducible Research!

Author's title

Investigate the validity of the model: Clothing Production = constant + ran...

Author

*Unverified author*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Mon, 27 Oct 2008 16:35:05 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225146996agjqb25zdcy3rn2.htm/, Retrieved Sun, 19 May 2024 14:56:13 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19698, Retrieved Sun, 19 May 2024 14:56:13 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

163

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Investigate the v...] [2008-10-27 22:35:05] [1d70db93c36870279a28f714be132c6e] [Current]

Feedback Forum

2008-10-29 12:53:29 [Veerle Jackers] [reply] 
Het is hier niet duidelijk dat je begrijpt dat je een nieuwe reeks moet maken door de kledingproductie te delen door de totale productie! Hier is niets van terug te vinden in je document.  
Dit is de reeks die je dan bekomt: 
http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/27/t122512830874wesjyg9o4fewb.htm
2008-11-03 09:59:40 [Chi-Kwong Man] [reply] 
1ste assumptie: random drawings?  
 
Hier kan je best kijken naar de autocorrelatie op de lagplot (welke jij niet had). Deze grafiek kan je bekomen door het aantal lags in te vullen: 12 of 36, m.a.w. niet naar de run sequence plot kijken. Hier kan je zien dat er bij lag 12 de correlatie groot is, en niet toevallig ook bij 24, dus de piek herhaalt zich alle 12 maanden. Dit is een duidelijke indicatie van seizoenaliteit. Er is dus autocorrelatie en de punten zijn dus niet random.  
 
2de assumptie: fixed distribution?  
1ste manier: kijken naar histogram en density plot --> lijkt vrij sterk op een normaalverdeling. De kleine afwijking in de grafiek is niet erg. 
Een 2de mogelijkheid is kijken naar QQ-plot: de punten liggen dicht bij de lijn --> normaalverdeling. 
 
3de assumptie: has the distribution a fixed location  
 
Hier moet men niet naar de QQ-plot kijken, maar naar de run sequence plot. Er is een daling als men ziet naar de eerste grafiek, dus geen constante, maar moeilijk te zien, dus moeten we een andere methode gebruiken. Centrale tendens. Hier moet men naar de trimmed mean kijken, de grafiek verloopt redelijk constant lijkt, wat dus betekent dat de tijdreeks ook vrij constant is. 
 
Assumptie 4: has the distribution a fixed variation  
 
Deze kan je vinden op de run sequence plot grafiek. Deze moet je in 2 hakken: in het linkergedeelte kan men zien dat de spreiding van de Y-as groter is als het rechtergedeelte. M.a.w. geen vaste variatie. 
 
Het model voldoet dus niet aan alle 4 voorwaarden, dus niet geschikt
2008-11-03 17:52:44 [339a57d8a4d5d113e4804fc423e4a59e] [reply] 
De student heeft enkele foutjes gemaakt in zijn berekening. Men moet het aantal lags instellen en best in 12,24 of 36. 
 
Ass 1:  
De student probeert deze assumptie te staven via de Run Suquence plot, maar dit is niet correct. Men moet deze assumptie controleren door naar de lagplot te kijken. Op de lagplot kan men zien dat elk punt onafhankelijk is van elkaar en dat er dus sprake is van autocorrelatie. 
 
Ass 2: 
Op de densityplot kan men zien dat deze mooi bellshaped is. We merken wel op dat er weliswaar een kleine deuk in zit. Wanneer we kijken op het histogram, zien we dat deze deuk te verklaren is door het redelijk hoge aantal in de tweede klasse. Dit verandert echter niets aan de spreiding. We kunnen hier spreken van een normaalverdeling. 
 
Ass 3: 
Er is hier geen 'fixed location', men ziet een lichte daling op de Run Sequence Plot. Deze daling is echter een vermoeden en is niet uitgesproken. 
 
Ass 4: 
Deze is in tegenstelling tot wat de student denkt, wel mogelijk. Hiervoor kijkt men naar spreiding van de random component. Op de Run Sequence plot deelt men de grafiek als het ware in twee. men kan zien dat de grafiek in het tweede deel meer schommelt dan in het eerste deel. De spreiding van de random component is dus gelijk. 
2008-11-03 19:12:52 [Stijn Loomans] [reply] 
De student heeft hier niet begrepen dat je een nieuwe reeks moet maken door de kledingproductie te delen door de totale productie!Zoals reeds hierboven vermeld door Veerle. 
 
De student had ook de lags moeten ingeven ( namelijk 12 of 36)  
 
Assumptie 1:Are the data autocorrelated? (The model assumes no autocorrelation)  
We kunnen dit gaan uittesten door de autocorrelatie of het lagplot te gebruiken. We kunnen uit de lagplot afleiden dat de autocorrelatie heel dicht bij 0 ligt . Als we met lags gaan werken kunnen we zien dat bij lag 12 , lag 24 er beide keren een grote correlatie voorkomt. Dus een seizonale correlatie optreed in deze reeks.  
Hierdoor kun je ook een voorspelling voor de toekomst maken. De 2 stippenlijnen geven de betrouwbaarheidsintervallen weer met een waarschijnlijkheid van 95%. Waardoor er dus een kans van 5% is dat de autocorrelatie erbuiten valt  
 
Conclusie: De tijdreeks is niet random want bevat seizoensgebonden correlatie.  
 
Assumption 2: Is the random component generated by a fixed distribution? (The model assumes a fixed distribution)  
 
Voor deze assumption moeten we gaan zien naar het histogram en density plot  
Je kan hier op zien dat het een normaalverdeling is( met uitschieter aan beide kanten) .  
Ook kunnen we gaan zien naar het Q-Q plot.  
Hier kan je dan een denkbeeldige lijn door de punten trekken. Hier blijkt dat de meeste punten dan op die denkbeeldige lijn zullen liggen dus normaalverdeling.  
 
Assumption 3: Is the deterministic component constant? (The model assumes that the distribution has a fixed location)  
 
We kijken hierbij naar het run sequence plot. Op lange termijn is deze reeks niet constant . Maar we kunnen ook gaan zien of het gemiddelde constant is , via de central tendency's.  
Bij de robustness van central tendency zien we toch dat het verloop vrij constant is.  
 
Concluse : Maar toch vermoeden we dat het verloop op lange termijn dalend is.  
 
assumtion 4:  
Bij deze assumtie maken we nogmaals gebruik van de run sequence plot.  
we kijken hierbij naar de spreiding van de reeks over de tijd heen.  
 
Om deze grafiek te bekijken splits je hem in twee delen. De spreiding van het eerste deel is groter dan die van het tweede deel.  
Waardoor we kunnen afleiden dat de reeks geen fixed variation heeft . Want ze schommeld te hard.  
 
Conlcusion : De tijdreeks voldoet niet aan het model 
2008-11-03 21:32:00 [Bonifer Spillemaeckers] [reply] 
Assumptie 1 : Voor deze assumptie moeten we niet naar de Run Sequence Plot kijken maar naar de Autocorrelation Function-grafiek. Wanneer we bij de berekeningen de lags instellen op 36 kunnen we een periode van 3 jaar bekijken. We bemerken dat niet alle lijnen binnen het betrouwbaarheidsinterval liggen. Kijken we naar de maanden 12, 24 en 36 dan liggen de lijnen opmerkelijk ver buiten het betrouwbaarheidsinterval. Dit duidt op een positieve seizoenale correlatie. 
 
Assumptie 2 : We bemerken inderdaad een aantal uitschieters in het histogram en in het density plot. Er wordt dus licht afgeweken van de normale verdeling.  
 
Assumptie 3 : Er is hier geen 'fixed location', men ziet een lichte daling op de Run Sequence Plot. 
 
Assumptie 4 : Om te zien of er een vaste variatie is te bemerken binnen de waarden, kijken we naar het Run Sequence Plot. We bemerken in het begin (t.e.m. 30) een terugkerend patroon, verder in de grafiek verlopen de waarden gelijkmatig op- en neergaand met opvallend minder uitschieters. 
 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19698&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19698&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19698&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19698&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19698&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19698&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 0 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Investigate the validity of the model: Clothing Production = constant + ran...

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code