Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationMon, 27 Oct 2008 11:37:43 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225129098cbskrx5o75ds3qj.htm/, Retrieved Sun, 19 May 2024 14:57:55 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19312, Retrieved Sun, 19 May 2024 14:57:55 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact165
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [] [2008-10-27 17:37:43] [e0f4dc76ea1a8276fe566258b977cec4] [Current]
-   P       [Univariate Explorative Data Analysis] [Q2 Univariate exp...] [2008-10-31 12:44:32] [d134696a922d84037f02d49ded84b0bd]
- RMP         [Central Tendency] [Qc central tendency] [2008-10-31 13:16:14] [d134696a922d84037f02d49ded84b0bd]
Feedback Forum
2008-10-31 13:04:23 [Stijn Van de Velde] [reply
Je bent hier vergeten om de gewenste lag in te vullen. Hiervoor had je bijvoorbeeld 12 of 36 (het maximum) kunnen nemen. Op onderstaande link zie je wat dan het resultaat had geweest, ik heb daarvoor lag 36 genomen.

http://www.freestatistics.org/blog/date/2008/Oct/31/t1225457138bdsczdub7e7sbwh.htm

1ste assumptie: random drawings?
Er zijn maar 2 pieken (naast lag=0) die buiten het 95% betrouwbaarheids interval (de stippellijntjes) liggen. Deze bevinden zich bij lag=12 en lag=24. Als je naar lag=36 kijkt zie je daar ook een piek, al ligt deze wel binnen het 95% interval.
Met andere woorden: de piek herhaald zich elke 12 maanden. Men kan bij deze tijdsreeks dus spreken van seizoenaliteit.

=> de tijdreeks is random.

Als we naar de lagplot grafiek kijken zien we ook een soort 'puntenwolk', dewelke er ook op duid dat de tijdreeks random is.
  2008-10-31 13:11:19 [Stijn Van de Velde] [reply
aanvulling:

2de assumptie: fixed distribution?
Hiervoor hebben we 3 mogelijkheden: we kunnen kijken naar het verloop van het histogram, het density plot en het normal Q-Q plot.

Bij deze 3de moeten de punten precies op de rechte liggen om een perfecte normaal verdeling te hebben. Dit is bij deze tijdreeks niet helemaal het geval.
Dit word ook bevestigd door de 2 eerste methoden. Er lijkt, niet zoals de student zegt, een kleine slag aan de linkerkant te zitten.

Al bij al kan men toch spreken van een vrij normale verdeling.
    2008-10-31 13:18:25 [Stijn Van de Velde] [reply
Aanvulling

3de assumptie: has the distribution a fixed location
Kijken naar het Run Sequence Plot.
Lijkt de tijdreeks op lange termijn constant te blijven, of is er eerder een stijging/daling merkbaar?
Omdat dit niet altijd even duidelijk is kan men best de central tendency berekenen, en dan kijken naar de trimmed mean.

De trimmed mean lijkt hier constant, wat wil zeggen dat de tijdreeks zelf ook vrij constant is.
link: http://www.freestatistics.org/blog/date/2008/Oct/31/t12254590302bbxtdnhnhsyzak.htm
      2008-10-31 13:23:49 [Stijn Van de Velde] [reply
Aanvulling

Assumtion 4: had the distribution a fixed variation
Run sequence plot:
Kijken naar de grootte van de flucuatie over de Y-as. Deze moet redelijk constant blijven.
Aan deze voorwaarde lijkt inderdaad niet voldaan. Er zijn korte en grote pieken.

Algemene conclusie: Er is inderdaad niet aan alle voorwaarden voldaan, dus de tijdreeks voldoet niet aan het model van: Clothing Production = constant + random component.
2008-11-01 11:05:47 [2df1bcd103d52957f4a39bd4617794c8] [reply
Unverified author, dit wijst erop dat student de gemaakte berekening niet correct heeft weten op te slaan onder eigen inloggegevens...

Assumptie1: We kunnen opmaken uit de autocorrelatie functie en de lagplot dat de tijdsreeks random is. In de autocorrelatie functie komen de outliers om de 12 maanden terug. Er is maw sprake van seizonaliteit. De lagplot, welke het verband weergeeft tussen enerzijds het verleden en anderzijds het heden, geeft ook een egale spreiding van de punten weer.

Assumptie2: We bekijken het histogram of densety plot. Uit deze gegevens concluderen we dat we over een vaste, normale verdeling kunnen spreken. Het QQ plot leert ons ongeveer hetzelfde, de punten van de grafiek liggen zeer dicht bij de rechte.

Assumptie3: Het Run sequence plot wordt bekeken om op te maken of we over een constante locatie kunnen spreken. We merken op lange termijn echter een lichte daling van de gegevens. De central tendency, meer bepaald de trimmed mean, leert ons echter dat de daling zeer minimaal is.

Assumptie4: De spreiding in de loop der tijd wordt hier bekeken. Deze is, wanneer we het Run sequence plot bekijken, niet constant.

Er is dus niet aan alle voorwaarden voldaan en we concluderen dus dat het model niet voldoet.

Assumptie4:
2008-11-03 08:48:33 [Bas van Keken] [reply
Seizoenaliteit is samengevat de correlatie van data, dat op een bepaald terugkomend moment over een periode (langer dan 1 jaar) wordt gemeten.
2008-11-03 08:49:36 [256f97d8b7c07ed49f142eff724c6520] [reply
Je had hier inderdaad de lags moeten toepassen. Dan kon je zien dat op lag 12 en lag 24 dat er een terugkerend patroon is. Hier kan je dus spreken van seizoensinvloed.
2008-11-03 08:54:37 [Bas van Keken] [reply
U schrijft bij assumptie 2 over een normaalverdeling aan de rechter kant, dit is echter onjuist. Op het oog zou u kunnen stellen dat de grafiek aan de rechterzijde neigt naar een normaalverdeling.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19312&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19312&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19312&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19312&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19312&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19312&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')