Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_tukeylambda.wasp

Title produced by software

Tukey lambda PPCC Plot

Date of computation

Mon, 27 Oct 2008 18:22:36 -0600

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225153414pmqsnjfitqo70i6.htm/, Retrieved Sun, 19 May 2024 19:49:42 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19719, Retrieved Sun, 19 May 2024 19:49:42 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

187

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Tukey lambda PPCC Plot] [Investigating Dis...] [2007-10-21 16:01:20] [b9964c45117f7aac638ab9056d451faa]
F R  D    [Tukey lambda PPCC Plot] [Q1] [2008-10-28 00:22:36] [40845526110da2d5a5bf7b165da84e03] [Current]

Feedback Forum

2008-11-03 09:30:40 [Zeno Thoelen] [reply] 
2008-11-03 09:31:16 [a7e076854c32462fd499d2de3f6d4e86] [reply] 
Deze oplossing stemt overeen met die van de voorbeeld-student en is correct.
2008-11-03 19:10:55 [Jan Helsen] [reply] 
De oplossing is op een correcte manier berekend. De student had wel kunnen weergeven wat het nut is van deze berekening. In dit geval bewijs gaat het om een normaalverdeling wat er op wijst dat de steekproeven niet auto-gecorreleerd zijn.
2008-11-03 19:17:16 [Nathalie Boden] [reply] 
2008-11-03 19:48:43 [Nathalie Boden] [reply] 
Hierbij zien we dat de student de juiste methode heeft gebruikt maar zo staat er niet vermeld dat de steekproeven onafhankelijk van elkaar moeten zijn en dat alle individuen de kans moeten hebben om in de steekproef terecht te komen. Ze moeten met andere woorden onafhankelijk zijn van elkaar. Zo willen we de eigenschap van de populatie meten aan de hand van deze steekproeven. Zo zien we ook dat er geen sprake is van autocorrelatie.
2008-11-03 20:17:29 [Nathalie Boden] [reply] 
In mijn vorige beoordeling van een andere student zie je het juiste resultaat dat de student moet bekomen: http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225735999b3d14khnwgk3qae.htm 
 
Assumptie 1: we geven hier het aantal lags in namelijk 36. In de eerste lagplot gaan we het verband zoeken tussen het heden en het verleden omdat de periode van log x=k-1 vertraagt is met 1 periode. We zien hier dat de autocorrelatie bijna gelijk is aan 0 en maar lichtjes positief is. Autocorrelatie is de maatstaf die wordt aangegeven of puntenwolk op een rechte gelegen is. Bij de laagste lagplot zien we dat er een positieve seizonale autocorrelatie is. Zo zien we dat er maanden zijn waar er veel en weinig geproduceerd wordt. Zo kunnen we een voorspelling doen jaar naar jaar. Conclusie= de tijdreeks is niet random, maar ze bevat wel degelijk autocorrelatie naar seizonale autocorrelatie 
 
Assumptie 2:We kijken hier naar het histogram hier zien we dat we min of meer een normale verdeling hebben. Zo kijken we ook naar de density plot (afgevlakte versie van het histogram). Hieruit kunnen we zien dat dit sterk lijkt op een normale verdeling. Ook op de normal q-q plot zien we op de verticale as de quantilen van deze reeks en op de horizontale as= de theoretische quantilen indien er een normale verdeling zou zijn. We zien hier dat de meeste punten vrij dicht op de lijn bevinden. Conclusie= we zitten vrij dicht bij een normale verdeling, ondanks er geen autocorrelatie is.  
 
Assumptie 3: Je kan vermoeden dat op lange termijn de reeks niet constant is, maar het is zeer moeilijk om het op het zicht te zien. Daarom gaan we de methode van de central tendancy toepassen op deze reekst. We zien hier dat het gemiddelde dicht rond de 87 schommelt. We zien hier ook dat outliers geen invloed hebben. Conclusie= we vermoeden dat er een dalende tendens is op lange termijn. 
 
Assumptie 4: Outliers hebben geen effect op het gemiddelde. Hier gaan we kijken naar 'run sequence plot'. We gaan kijken naar de spreiding van de reeks doorheen de tijd. Zo zien we dat het linker gedeelte harder schommelt dan het rechtergedeelte. Zo kunnen we in de r-code x <- x - .... (voorspelling van het gemiddelde) We zien hier in het resultaat dat het gemiddelde nu rond 0 ligt.
2008-11-03 20:44:03 [Kristof Francken] [reply] 
De student heeft inderdaad gelijk wanneer hij zegt dat de maximumcorrelatie zich bevindt bij een lamda 0,14. Hij/zij vermeldt er ook keurig bij dat we hier te maken hebben met een normaal-verdeling. De voorwaarden die nodig zijn om over een normaalverdeling te spreken vermeldt de persoon in kwestie echter niet. De voorwaarden zijn 1) De steekproeven moeten onafhankelijk zijn van elkaar 2) elke individu moeten de zelfde kans hebben om in de steekproef te zitten. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19719&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19719&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19719&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

Tukey Lambda - Key Values
Distribution (lambda)	Correlation
Approx. Cauchy (lambda=-1)	0.681034394717584
Exact Logistic (lambda=0)	0.984820721672163
Approx. Normal (lambda=0.14)	0.989505916159088
U-shaped (lambda=0.5)	0.985385537255734
Exactly Uniform (lambda=1)	0.97511352322751

\begin{tabular}{lllllllll}
\hline
Tukey Lambda - Key Values \tabularnewline
Distribution (lambda) & Correlation \tabularnewline
Approx. Cauchy (lambda=-1) & 0.681034394717584 \tabularnewline
Exact Logistic (lambda=0) & 0.984820721672163 \tabularnewline
Approx. Normal (lambda=0.14) & 0.989505916159088 \tabularnewline
U-shaped (lambda=0.5) & 0.985385537255734 \tabularnewline
Exactly Uniform (lambda=1) & 0.97511352322751 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19719&T=1

[TABLE]
[ROW][C]Tukey Lambda - Key Values[/C][/ROW]
[ROW][C]Distribution (lambda)[/C][C]Correlation[/C][/ROW]
[ROW][C]Approx. Cauchy (lambda=-1)[/C][C]0.681034394717584[/C][/ROW]
[ROW][C]Exact Logistic (lambda=0)[/C][C]0.984820721672163[/C][/ROW]
[ROW][C]Approx. Normal (lambda=0.14)[/C][C]0.989505916159088[/C][/ROW]
[ROW][C]U-shaped (lambda=0.5)[/C][C]0.985385537255734[/C][/ROW]
[ROW][C]Exactly Uniform (lambda=1)[/C][C]0.97511352322751[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19719&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19719&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Tukey Lambda - Key Values
Distribution (lambda)	Correlation
Approx. Cauchy (lambda=-1)	0.681034394717584
Exact Logistic (lambda=0)	0.984820721672163
Approx. Normal (lambda=0.14)	0.989505916159088
U-shaped (lambda=0.5)	0.985385537255734
Exactly Uniform (lambda=1)	0.97511352322751

Figure 1

PNG link

Postscript link

PDF link

Parameters (Session):

Parameters (R input):

R code (references can be found in the software module):

gp <- function(lambda, p)
{
(p^lambda-(1-p)^lambda)/lambda
}
sortx <- sort(x)
c <- array(NA,dim=c(201))
for (i in 1:201)
{
if (i != 101) c[i] <- cor(gp(ppoints(x), lambda=(i-101)/100),sortx)
}
bitmap(file='test1.png')
plot((-100:100)/100,c[1:201],xlab='lambda',ylab='correlation',main='PPCC Plot - Tukey lambda')
grid()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Tukey Lambda - Key Values',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Distribution (lambda)',1,TRUE)
a<-table.element(a,'Correlation',1,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Approx. Cauchy (lambda=-1)',header=TRUE)
a<-table.element(a,c[1])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Exact Logistic (lambda=0)',header=TRUE)
a<-table.element(a,(c[100]+c[102])/2)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Approx. Normal (lambda=0.14)',header=TRUE)
a<-table.element(a,c[115])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'U-shaped (lambda=0.5)',header=TRUE)
a<-table.element(a,c[151])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Exactly Uniform (lambda=1)',header=TRUE)
a<-table.element(a,c[201])
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code