Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationSun, 26 Oct 2008 10:00:19 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/26/t1225036894h4r2eghhsx1ih2r.htm/, Retrieved Sun, 19 May 2024 14:35:54 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18962, Retrieved Sun, 19 May 2024 14:35:54 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact148
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigating dis...] [2007-10-22 19:45:25] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [onderzoeken eigen...] [2008-10-26 16:00:19] [0d500ce70fb61d771562626855e78bdd] [Current]
-   P       [Univariate Explorative Data Analysis] [Verbeterde versie...] [2008-10-29 21:37:47] [495cd80c1a9baafb03c09cd9ab8d8fb5]
Feedback Forum
2008-10-29 21:46:41 [Kevin Truyts] [reply
De studente heeft de bal een beetje mis geslagen en zich blind gestaard op de oplossing van de student van vorig jaar.
Bij de eerste veronderstelling is de studente naar de run-sequence plot gaan kijken om deze assumptie te beoordelen. Tijdens het college werd gezegd dat hiervoor naar de lag-plot moest worden gezien. Hiervoor diende de lag gelijk te stellen aan 12 of 36.
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Oct/29/t1225316320uecsje613mndrsm.htm, Retrieved Wed, 29 Oct 2008 21:38:46 +0000
Bij deze tijdreeks zien we dat de punten een beetje gespreid liggen op de grafiek.
Op de laatste grafiek zien we wel dat we met vrij veel outliers zitten. Hopelijk is hier een logisch verband voor.
Conclusie: de tijdreeks is niet helemaal rondom aangezien er toch een heel deel punten op de rechte liggen.
Tijdens de bespreking van de 2de assumptie kunnen we niet zeggen dat er een normaal verdeling is. Dit is te wijten aan het feit dat de density plot afwijkt naar rechts.
Voor de 3de assumptie moest er worden gezien naar de central tendency. Dit is ook (moeilijk) af te lezen op de run-sequence plot. Op lange termijn is het niveau niet constant en zien we een afteruitgang is.
Hiercoor moest naar de run-sequence worden gezien. We bekijken dan de spreiding van de observaties. alle observaties hebben ongeveer eenzelfde spreiding.
Hieruit kunnen we besluiten dat het model niet voldoet aan de voorwaarden.
2008-11-01 17:35:30 [Kevin Neelen] [reply
Er is voor deze vraag een juiste methode gebruikt, namelijk de Univariate Explorative Data Analysis, maar er zijn dikwijls de verkeerde grafieken gebruikt voor de assumpties tot een juiste conclusie te komen.
Assumption 1: Are the data autocorrelated? (The model assumes no autocorrelation). De student heeft hier naar de Run-Seqsuence-Plot gekeken, maar hieruit kan men niet echt conclusies trekken. Hiervoor zou beter gekeken moeten worden naar de lag-plot die in deze computation niet berekend is. Bijgevoegd de link waar het aantal lags is ingesteld op 12: http://www.freestatistics.org/blog/index.php?v=date/2008/Oct/31/t12254779576brds41btb14eyv.htm Hieruit kan besloten worden dat er echt sprake is van autocorrelatie en er bijgevolg dus gesproken kan worden van randomness. De gegevens liggen dus vrij verspreid, hoewel ze wel een lichtelijk stijgende tendens kennen.
Assumption 2: Is the random component generated by a fixed distribution? (The model assumes a fixed distribution). Er is hier gekeken naar het Density-Plot, wat correct is. Daarnaast kunnen ook het QQ-Plot en het histogram bestudeerd worden. De conclusie van de studente dat er bij haar tijdreeks sprake is van een normaalverdeling, klopt. Deze conclusie wordt enkel bevestigd als gekeken wordt naar het QQ-Plot en het histogram.
Assumption 3: Is the deterministic component constant? (The model assumes that the distribution has a fixed location). Hierbij kan het Run-Sequence-Plot bestudeerd worden, wat hier echter niet is gedaan. Als we langsheen de topwaarden in de grafiek een rechte kunnen trekken, is er sprake van een fixed location. Dat is hier zeker niet het geval. Er moet echter opgemerkt worden, dat deze assumptie best op lange termijn gezien kan worden om echt grondige conclusies te kunnen trekken.
Assumption 4: does the random component have a fixed variation? (The model assumes a distribution with fixed variation). Hierbij moet het Run-Sequence-Plot bestudeerd worden, wat hier echter niet is gedaan. Als we het Run-Sequence-Plot bekijken, zien we dat in het eerste en laatste gedeelte van de grafiek, de verticale spreiding van de gegevens ongeveer dezelfde is. In het middenstuk zien we dan weer een grotere verticale spreiding tussen de gegevens.
2008-11-03 17:17:41 [Jeroen Michel] [reply
Samenvattend waarnaar de vorige studenten verwijzen is dat er inderdaad een berekening is gemaakt waarbij dezelfde fouten zijn ingeslopen als bij de student van vorig jaar. De nodige parameters bij de berekening zijn niet aangepast geweest.

Onderstaande link geeft ook nog maals de juiste berekeningen en feedback weer:
Assumptie 1:
Hierbij heb ik deze keer inderdaad gekeken naar de lag plot ipv. de run sequence plot. De resultaten zijn terug te vinden onder deze link:
lag 1: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t12256648775yuu0x8xxg6fgch.htm, Retrieved Sun, 02 Nov 2008 22:28:06 +0000 Tevens houden we rekening met de puntenwolken zoals opgesomd door de vorige studente.

lag 12: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665259gny0zbzwwq6rpqr.htm, Retrieved Sun, 02 Nov 2008 22:34:28 +0000

lag 36: Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665398n329mjtqxwani17.htm, Retrieved Sun, 02 Nov 2008 22:36:51 +0000

Assumptie 2:
Hier is inderdaad een foute interpretatie gemaakt. Hier is er inderdaad sprake van een normaalverdeling. Aangezien er in Q1 geen autocorrelatie is, is er hier sprake van normaalverdeling. De resulaten zijn wel op de juiste grafieken afgelezen geweest.

Assumptie 3:
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL http://www.freestatistics.org/blog/date/2008/Nov/02/t1225665670l3jnqcbv4p6c0d6.htm, Retrieved Sun, 02 Nov 2008 22:41:15 +0000
In bovenstaande berekening vind u de juiste oplossingen terug. Hier zijn de opmerkingen van voorgaande studente op waar te nemen en zien we op het einde inderdaad de dalende trend.

Assumptie 4:
Hier is er niet gewerkt door de verschillende lags in te stellen. Belangrijk is hier wel dat deze aanpassingen gebeuren om tot volgende voorwaarde te komen: Clothing Production = constant + random component.
2008-11-03 21:09:01 [Hidde Van Kerckhoven] [reply
Er is voor deze vraag een juiste methode gebruikt
Assumptie 1: hier is naar de verkeerde grafiek gekeken, dit had de lag plot moeten zijn (lag 12 of 36) als we dit doen zien we dat er sprake is van een autocorrelatie
Assumptie 2: goed geinterpreteerd en opgelost
Assumptie 3: hier had de student de run sequence plot moeten gebruiken, zo kunnen we zien dat er geen sprake is van een fixed location
Assumptie 4: ook hier kijken we naar de run sequence plot, we kunnen hier spreken van enkele outliers
er is niet aan al de voorwaarden voldaan!

Post a new message
Dataseries X:
572.775
574.205
579.799
590.072
593.408
597.141
595.404
612.117
628.232
628.884
620.735
569.028
567.456
573.100
584.428
589.379
590.865
595.454
594.167
611.324
612.613
610.763
593.530
542.722
536.662
543.599
555.332
560.854
562.325
554.788
547.344
565.464
577.992
579.714
569.323
506.971
500.857
509.127
509.933
517.009
519.164
512.238
509.239
518.585
522.975
525.192
516.847
455.626
454.724
461.251
470.439
474.605
476.049
471.067
470.984
502.831
512.927
509.673
484.015
431.328
436.087




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18962&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18962&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18962&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum431.328
Q1509.239
median554.788
mean543.618704918033
Q3589.379
maximum628.884

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 431.328 \tabularnewline
Q1 & 509.239 \tabularnewline
median & 554.788 \tabularnewline
mean & 543.618704918033 \tabularnewline
Q3 & 589.379 \tabularnewline
maximum & 628.884 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18962&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]431.328[/C][/ROW]
[ROW][C]Q1[/C][C]509.239[/C][/ROW]
[ROW][C]median[/C][C]554.788[/C][/ROW]
[ROW][C]mean[/C][C]543.618704918033[/C][/ROW]
[ROW][C]Q3[/C][C]589.379[/C][/ROW]
[ROW][C]maximum[/C][C]628.884[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18962&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18962&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum431.328
Q1509.239
median554.788
mean543.618704918033
Q3589.379
maximum628.884



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')