Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_edauni.wasp

Title produced by software

Univariate Explorative Data Analysis

Date of computation

Sun, 26 Oct 2008 10:00:19 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/26/t1225036894h4r2eghhsx1ih2r.htm/, Retrieved Sun, 19 May 2024 14:35:54 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18962, Retrieved Sun, 19 May 2024 14:35:54 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

148

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Explorative Data Analysis] [Investigating dis...] [2007-10-22 19:45:25] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [onderzoeken eigen...] [2008-10-26 16:00:19] [0d500ce70fb61d771562626855e78bdd] [Current]
-   P       [Univariate Explorative Data Analysis] [Verbeterde versie...] [2008-10-29 21:37:47] [495cd80c1a9baafb03c09cd9ab8d8fb5] 

Feedback Forum

2008-10-29 21:46:41 [Kevin Truyts] [reply] 
De studente heeft de bal een beetje mis geslagen en zich blind gestaard op de oplossing van de student van vorig jaar.  
Bij de eerste veronderstelling is de studente naar de run-sequence plot gaan kijken om deze assumptie te beoordelen. Tijdens het college werd gezegd dat hiervoor naar de lag-plot moest worden gezien. Hiervoor diende de lag gelijk te stellen aan 12 of 36. 
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Oct/29/t1225316320uecsje613mndrsm.htm, Retrieved Wed, 29 Oct 2008 21:38:46 +0000 
Bij deze tijdreeks zien we dat de punten een beetje gespreid liggen op de grafiek.  
Op de laatste grafiek zien we wel dat we met vrij veel outliers zitten. Hopelijk is hier een logisch verband voor. 
Conclusie: de tijdreeks is niet helemaal rondom aangezien er toch een heel deel punten op de rechte liggen.  
Tijdens de bespreking van de 2de assumptie kunnen we niet zeggen dat er een normaal verdeling is. Dit is te wijten aan het feit dat de density plot afwijkt naar rechts.  
Voor de 3de assumptie moest er worden gezien naar de central tendency. Dit is ook (moeilijk) af te lezen op de run-sequence plot. Op lange termijn is het niveau niet constant en zien we een afteruitgang is.  
Hiercoor moest naar de run-sequence worden gezien. We bekijken dan de spreiding van de observaties. alle observaties hebben ongeveer eenzelfde spreiding. 
Hieruit kunnen we besluiten dat het model niet voldoet aan de voorwaarden. 
2008-11-01 17:35:30 [Kevin Neelen] [reply] 
Er is voor deze vraag een juiste methode gebruikt, namelijk de Univariate Explorative Data Analysis, maar er zijn dikwijls de verkeerde grafieken gebruikt voor de assumpties tot een juiste conclusie te komen. 
Assumption 1: Are the data autocorrelated? (The model assumes no autocorrelation). De student heeft hier naar de Run-Seqsuence-Plot gekeken, maar hieruit kan men niet echt conclusies trekken. Hiervoor zou beter gekeken moeten worden naar de lag-plot die in deze computation niet berekend is. Bijgevoegd de link waar het aantal lags is ingesteld op 12: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/31/t12254779576brds41btb14eyv.htm Hieruit kan besloten worden dat er echt sprake is van autocorrelatie en er bijgevolg dus gesproken kan worden van randomness. De gegevens liggen dus vrij verspreid, hoewel ze wel een lichtelijk stijgende tendens kennen.  
Assumption 2: Is the random component generated by a fixed distribution? (The model assumes a fixed distribution). Er is hier gekeken naar het Density-Plot, wat correct is. Daarnaast kunnen ook het QQ-Plot en het histogram bestudeerd worden. De conclusie van de studente dat er bij haar tijdreeks sprake is van een normaalverdeling, klopt. Deze conclusie wordt enkel bevestigd als gekeken wordt naar het QQ-Plot en het histogram.  
Assumption 3: Is the deterministic component constant? (The model assumes that the distribution has a fixed location). Hierbij kan het Run-Sequence-Plot bestudeerd worden, wat hier echter niet is gedaan. Als we langsheen de topwaarden in de grafiek een rechte kunnen trekken, is er sprake van een fixed location. Dat is hier zeker niet het geval. Er moet echter opgemerkt worden, dat deze assumptie best op lange termijn gezien kan worden om echt grondige conclusies te kunnen trekken.  
Assumption 4: does the random component have a fixed variation? (The model assumes a distribution with fixed variation). Hierbij moet het Run-Sequence-Plot bestudeerd worden, wat hier echter niet is gedaan. Als we het Run-Sequence-Plot bekijken, zien we dat in het eerste en laatste gedeelte van de grafiek, de verticale spreiding van de gegevens ongeveer dezelfde is. In het middenstuk zien we dan weer een grotere verticale spreiding tussen de gegevens.
2008-11-03 17:17:41 [Jeroen Michel] [reply] 
Samenvattend waarnaar de vorige studenten verwijzen is dat er inderdaad een berekening is gemaakt waarbij dezelfde fouten zijn ingeslopen als bij de student van vorig jaar. De nodige parameters bij de berekening zijn niet aangepast geweest.  
 
Onderstaande link geeft ook nog maals de juiste berekeningen en feedback weer:  
Assumptie 1:  
Hierbij heb ik deze keer inderdaad gekeken naar de lag plot ipv. de run sequence plot. De resultaten zijn terug te vinden onder deze link:  
lag 1: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t12256648775yuu0x8xxg6fgch.htm, Retrieved Sun, 02 Nov 2008 22:28:06 +0000 Tevens houden we rekening met de puntenwolken zoals opgesomd door de vorige studente.  
 
lag 12: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665259gny0zbzwwq6rpqr.htm, Retrieved Sun, 02 Nov 2008 22:34:28 +0000  
 
lag 36: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665398n329mjtqxwani17.htm, Retrieved Sun, 02 Nov 2008 22:36:51 +0000  
 
Assumptie 2:  
Hier is inderdaad een foute interpretatie gemaakt. Hier is er inderdaad sprake van een normaalverdeling. Aangezien er in Q1 geen autocorrelatie is, is er hier sprake van normaalverdeling. De resulaten zijn wel op de juiste grafieken afgelezen geweest.  
 
Assumptie 3:  
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665670l3jnqcbv4p6c0d6.htm, Retrieved Sun, 02 Nov 2008 22:41:15 +0000  
In bovenstaande berekening vind u de juiste oplossingen terug. Hier zijn de opmerkingen van voorgaande studente op waar te nemen en zien we op het einde inderdaad de dalende trend.  
 
Assumptie 4:  
Hier is er niet gewerkt door de verschillende lags in te stellen. Belangrijk is hier wel dat deze aanpassingen gebeuren om tot volgende voorwaarde te komen: Clothing Production = constant + random component.  
2008-11-03 21:09:01 [Hidde Van Kerckhoven] [reply] 
Er is voor deze vraag een juiste methode gebruikt 
Assumptie 1: hier is naar de verkeerde grafiek gekeken, dit had de lag plot moeten zijn (lag 12 of 36) als we dit doen zien we dat er sprake is van een autocorrelatie 
Assumptie 2: goed geinterpreteerd en opgelost 
Assumptie 3: hier had de student de run sequence plot moeten gebruiken, zo kunnen we zien dat er geen sprake is van een fixed location 
Assumptie 4: ook hier kijken we naar de run sequence plot, we kunnen hier spreken van enkele outliers 
er is niet aan al de voorwaarden voldaan!

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18962&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18962&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18962&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'George Udny Yule' @ 72.249.76.132

Descriptive Statistics
# observations	61
minimum	431.328
Q1	509.239
median	554.788
mean	543.618704918033
Q3	589.379
maximum	628.884

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 431.328 \tabularnewline
Q1 & 509.239 \tabularnewline
median & 554.788 \tabularnewline
mean & 543.618704918033 \tabularnewline
Q3 & 589.379 \tabularnewline
maximum & 628.884 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18962&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]431.328[/C][/ROW]
[ROW][C]Q1[/C][C]509.239[/C][/ROW]
[ROW][C]median[/C][C]554.788[/C][/ROW]
[ROW][C]mean[/C][C]543.618704918033[/C][/ROW]
[ROW][C]Q3[/C][C]589.379[/C][/ROW]
[ROW][C]maximum[/C][C]628.884[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18962&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18962&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations	61
minimum	431.328
Q1	509.239
median	554.788
mean	543.618704918033
Q3	589.379
maximum	628.884

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 0 ; par2 = 0 ;

Parameters (R input):

par1 = 0 ; par2 = 0 ;

R code (references can be found in the software module):

par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot   bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code