Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationThu, 23 Oct 2008 06:34:55 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/23/t1224765382m92le54q41i8u02.htm/, Retrieved Sun, 19 May 2024 12:56:35 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18491, Retrieved Sun, 19 May 2024 12:56:35 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywordsdistribution Q2
Estimated Impact199
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F R  D    [Univariate Explorative Data Analysis] [univariate explor...] [2008-10-23 12:34:55] [3817f5e632a8bfeb1be7b5e8c86bd450] [Current]
F    D      [Univariate Explorative Data Analysis] [Clothing/Total Pr...] [2008-10-23 13:17:47] [077ffec662d24c06be4c491541a44245]
F             [Univariate Explorative Data Analysis] [] [2008-10-25 13:20:42] [4c8dfb519edec2da3492d7e6be9a5685]
- RMPD      [] [confidence interv...] [-0001-11-30 00:00:00] [077ffec662d24c06be4c491541a44245]
F RMPD        [Harrell-Davis Quantiles] [Harrel davies met...] [2008-10-23 14:25:11] [077ffec662d24c06be4c491541a44245]
F   P           [Harrell-Davis Quantiles] [] [2008-10-25 13:29:43] [4c8dfb519edec2da3492d7e6be9a5685]
- R             [Harrell-Davis Quantiles] [Distribution verb...] [2008-10-28 17:04:37] [077ffec662d24c06be4c491541a44245]
F RM D        [Central Tendency] [mean of the error] [2008-10-23 14:45:08] [077ffec662d24c06be4c491541a44245]
F               [Central Tendency] [] [2008-10-25 13:55:42] [4c8dfb519edec2da3492d7e6be9a5685]
-           [Univariate Explorative Data Analysis] [] [2008-10-25 13:05:09] [4c8dfb519edec2da3492d7e6be9a5685]
F           [Univariate Explorative Data Analysis] [] [2008-10-25 13:08:49] [4c8dfb519edec2da3492d7e6be9a5685]
F   P         [Univariate Explorative Data Analysis] [] [2008-10-25 14:19:35] [4c8dfb519edec2da3492d7e6be9a5685]
F   P           [Univariate Explorative Data Analysis] [] [2008-10-25 14:25:52] [4c8dfb519edec2da3492d7e6be9a5685]
F                 [Univariate Explorative Data Analysis] [] [2008-10-27 08:04:13] [077ffec662d24c06be4c491541a44245]
F               [Univariate Explorative Data Analysis] [] [2008-10-27 08:02:47] [077ffec662d24c06be4c491541a44245]
-   P       [Univariate Explorative Data Analysis] [Verbetering distr...] [2008-10-28 15:34:23] [077ffec662d24c06be4c491541a44245]
- RMP       [Central Tendency] [distribution verb...] [2008-10-28 16:04:07] [077ffec662d24c06be4c491541a44245]
-   P       [Univariate Explorative Data Analysis] [] [2008-11-03 11:22:47] [2a0ad3a9bcadca2da0acb91636601c6c]
Feedback Forum
2008-10-28 16:35:34 [Glenn De Maeyer] [reply
Bij dit onderzoek maken we gebruik van 4 voorwaarden waaraan moet voldaan worden:

1. random drawings (onafhankelijke trekking)
2. from a fixed distribution (vaste verdeling)
3. with the distribution having fixed location (De verdeling heeft een constant niveau)
4. with the distribution having fixed variation (Ze hebben dezelfde spreiding)

Deze voorwaarden kan je testen door hier bepaalde berekeningen op uit te voeren. Ik gebruikte hier de juiste methode nl. 'Univariate Explorative Data Analysis' maar ik gaf het aantal lags niet in. Bij lags geef je best 12 in ofwel het maximum nl. 36.
Enkel indien u dit doet verschijnen ook de grafieken i.v.m. lag plot.

1. Random drawings:
Ik maakte hier gebruik van het 'Run sequence plot'. Ik had echter het lag plot moeten gebruiken. Op basis van de lag plot (k=1) lowess and regression line kunnen we stellen dat correlatie 0 is, omdat de puntenwolk rond en niet dichtbij de rechte ligt. Maar als we dan kijken naar de lag plot (k=12), and lowess en de autocorrelation function zien we dat er wel correlatie is. Er is hier een positieve correlatie. Op de autocorrelation function zien we uitschieters op lag 12, lag 24 en lag 36. We kunnen hier dus spreken van seizoenale correlatie.

conclusie: De tijdreeks is niet random, maar bevat wel degelijk autocorrelatie. Het is echter een speciale autocorrelatie nl. een seizoenale correlatie.

2. Is er een vaste verdeling?
Hiervoor concludeerde ik op basis van het histogram en het density plot dat er geen normaalverdeling is omdat beiden links een lichte uitstulping hebben. Deze uitstulping is echter verwaarloosbaar. We kunnen dit ook beoordelen op basis van het QQ plot.

conclusie: Er is hier dus een normaalverdeling.

3. Verdeling heeft een constant niveau.
Ik werkte hier met het run sequence plot. Indien we hier een rechte zouden door tekenen zou deze een dalend verloop kennen.

Conclusie: We vermoeden een daling maar zijn niet zeker.

4. fixed variation
Op basis van de run sequence plot zien we in het begin duidelijk een hogere fluctuatie dan naar het einde toe.
Omdat het hier eigenlijk gaat om de random component zou je eigenlijk het run sequence plot opnieuw moeten laten tekenen zonder de voorspelling. We moeten van de run sequence plot dus eigenlijk de voorspelling aftrekken. (Yt = C + Et => Ft = Yt - Et = c (constante is dus de voorspelling))
Welke voorspelling moet je er nu aftrekken? Indien er sprake is van outliers neem je best de mediaan. Indien er geen outliers zijn neem je het gemiddelde.
Je moet dus eigelijk in de R-code x <- x - 86.69 (gemiddelde) ingeven en dan opnieuw het run sequence plot bekijken.

Conclusie: Er is dus geen constante spreiding.

Algemeen besluit:
Er is niet aan alle voorwaarden voldaan dus de tijdreeks voldoet niet aan het model van: Clothing Production = constant + random component.
2008-11-03 11:28:41 [Hidde Van Kerckhoven] [reply
Hier zijn de lags wel ingevuld: http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225711432i6b5wtmzedbezq5.htm

De student heeft zich hier perfect verbeterd, hier valt erg weinig aan toe te voegen!
2008-11-03 20:23:27 [Thomas Baken] [reply
De student heeft de grafieken juist geïnterpreteerd maar aangezien hij het niet volgens het normale model heeft gedaan was het nogal verwarrend om het te kunnen beoordelen. Als volgt;

Assumptie 1: Er is wel degelijk autocorrelatie terug te vinden.
Assumptie 2: Er is geen normaalverdeling indien we rekening houden met de kleine slag in de linkerkant van de grafiek.
Assumptie 3: Op de grafiek kan je zien dat grafiek niet vlak en redelijk hard fluctueert.
Assumptie 4: Er zijn outliers op te merken waardoor we niet kunnen spreken van een random component met fixed variation.

M.A.W. geen goed model.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18491&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18491&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18491&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18491&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18491&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18491&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')