Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*Unverified author*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Mon, 27 Oct 2008 11:37:43 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/27/t1225129098cbskrx5o75ds3qj.htm/, Retrieved Sun, 19 May 2024 14:57:55 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19312, Retrieved Sun, 19 May 2024 14:57:55 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

165

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [] [2008-10-27 17:37:43] [e0f4dc76ea1a8276fe566258b977cec4] [Current]
-   P       [Univariate Explorative Data Analysis] [Q2 Univariate exp...] [2008-10-31 12:44:32] [d134696a922d84037f02d49ded84b0bd] 
- RMP         [Central Tendency] [Qc central tendency] [2008-10-31 13:16:14] [d134696a922d84037f02d49ded84b0bd] 

Feedback Forum

2008-10-31 13:04:23 [Stijn Van de Velde] [reply] 
Je bent hier vergeten om de gewenste lag in te vullen. Hiervoor had je bijvoorbeeld 12 of 36 (het maximum) kunnen nemen. Op onderstaande link zie je wat dan het resultaat had geweest, ik heb daarvoor lag 36 genomen. 
 
http://www.freestatistics.org/blog/date/2008/Oct/31/t1225457138bdsczdub7e7sbwh.htm 
 
1ste assumptie: random drawings? 
Er zijn maar 2 pieken (naast lag=0) die buiten het 95% betrouwbaarheids interval (de stippellijntjes) liggen. Deze bevinden zich bij lag=12 en lag=24. Als je naar lag=36 kijkt zie je daar ook een piek, al ligt deze wel binnen het 95% interval. 
Met andere woorden: de piek herhaald zich elke 12 maanden. Men kan bij deze tijdsreeks dus spreken van seizoenaliteit. 
 
=> de tijdreeks is random. 
 
Als we naar de lagplot grafiek kijken zien we ook een soort 'puntenwolk', dewelke er ook op duid dat de tijdreeks random is.
  2008-10-31 13:11:19 [Stijn Van de Velde] [reply] 
aanvulling: 
 
2de assumptie: fixed distribution? 
Hiervoor hebben we 3 mogelijkheden: we kunnen kijken naar het verloop van het histogram, het density plot en het normal Q-Q plot. 
 
Bij deze 3de moeten de punten precies op de rechte liggen om een perfecte normaal verdeling te hebben. Dit is bij deze tijdreeks niet helemaal het geval. 
Dit word ook bevestigd door de 2 eerste methoden. Er lijkt, niet zoals de student zegt, een kleine slag aan de linkerkant te zitten. 
 
Al bij al kan men toch spreken van een vrij normale verdeling.
    2008-10-31 13:18:25 [Stijn Van de Velde] [reply] 
Aanvulling 
 
3de assumptie: has the distribution a fixed location 
Kijken naar het Run Sequence Plot. 
Lijkt de tijdreeks op lange termijn constant te blijven, of is er eerder een stijging/daling merkbaar? 
Omdat dit niet altijd even duidelijk is kan men best de central tendency berekenen, en dan kijken naar de trimmed mean. 
 
De trimmed mean lijkt hier constant, wat wil zeggen dat de tijdreeks zelf ook vrij constant is. 
link: http://www.freestatistics.org/blog/date/2008/Oct/31/t12254590302bbxtdnhnhsyzak.htm
      2008-10-31 13:23:49 [Stijn Van de Velde] [reply] 
Aanvulling 
 
Assumtion 4: had the distribution a fixed variation 
Run sequence plot: 
Kijken naar de grootte van de flucuatie over de Y-as. Deze moet redelijk constant blijven. 
Aan deze voorwaarde lijkt inderdaad niet voldaan. Er zijn korte en grote pieken. 
 
Algemene conclusie: Er is inderdaad niet aan alle voorwaarden voldaan, dus de tijdreeks voldoet niet aan het model van: Clothing Production = constant + random component.
2008-11-01 11:05:47 [2df1bcd103d52957f4a39bd4617794c8] [reply] 
Unverified author, dit wijst erop dat student de gemaakte berekening niet correct heeft weten op te slaan onder eigen inloggegevens... 
 
Assumptie1: We kunnen opmaken uit de autocorrelatie functie en de lagplot dat de tijdsreeks random is. In de autocorrelatie functie komen de outliers om de 12 maanden terug. Er is maw sprake van seizonaliteit. De lagplot, welke het verband weergeeft tussen enerzijds het verleden en anderzijds het heden, geeft ook een egale spreiding van de punten weer. 
 
Assumptie2: We bekijken het histogram of densety plot. Uit deze gegevens concluderen we dat we over een vaste, normale verdeling kunnen spreken. Het QQ plot leert ons ongeveer hetzelfde, de punten van de grafiek liggen zeer dicht bij de rechte. 
 
Assumptie3: Het Run sequence plot wordt bekeken om op te maken of we over een constante locatie kunnen spreken. We merken op lange termijn echter een lichte daling van de gegevens. De central tendency, meer bepaald de trimmed mean, leert ons echter dat de daling zeer minimaal is. 
 
Assumptie4: De spreiding in de loop der tijd wordt hier bekeken. Deze is, wanneer we het Run sequence plot bekijken, niet constant. 
 
Er is dus niet aan alle voorwaarden voldaan en we concluderen dus dat het model niet voldoet. 
 
Assumptie4: 
2008-11-03 08:48:33 [Bas van Keken] [reply] 
Seizoenaliteit is samengevat de correlatie van data, dat op een bepaald terugkomend moment over een periode (langer dan 1 jaar) wordt gemeten.
2008-11-03 08:49:36 [256f97d8b7c07ed49f142eff724c6520] [reply] 
Je had hier inderdaad de lags moeten toepassen. Dan kon je zien dat op lag 12 en lag 24 dat er een terugkerend patroon is. Hier kan je dus spreken van seizoensinvloed.
2008-11-03 08:54:37 [Bas van Keken] [reply] 
U schrijft bij assumptie 2 over een normaalverdeling aan de rechter kant, dit is echter onjuist. Op het oog zou u kunnen stellen dat de grafiek aan de rechterzijde neigt naar een normaalverdeling.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19312&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19312&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19312&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19312&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19312&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19312&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	66.5
Q1	80.6
median	87.3
mean	86.8934426229508
Q3	94.1
maximum	109.7

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 0 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code