Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_tukeylambda.wasp
Title produced by softwareTukey lambda PPCC Plot
Date of computationMon, 27 Oct 2008 18:22:36 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/28/t1225153414pmqsnjfitqo70i6.htm/, Retrieved Sun, 19 May 2024 19:49:42 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=19719, Retrieved Sun, 19 May 2024 19:49:42 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact187
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Tukey lambda PPCC Plot] [Investigating Dis...] [2007-10-21 16:01:20] [b9964c45117f7aac638ab9056d451faa]
F R  D    [Tukey lambda PPCC Plot] [Q1] [2008-10-28 00:22:36] [40845526110da2d5a5bf7b165da84e03] [Current]
Feedback Forum
2008-11-03 09:30:40 [Zeno Thoelen] [reply
2008-11-03 09:31:16 [a7e076854c32462fd499d2de3f6d4e86] [reply
Deze oplossing stemt overeen met die van de voorbeeld-student en is correct.
2008-11-03 19:10:55 [Jan Helsen] [reply
De oplossing is op een correcte manier berekend. De student had wel kunnen weergeven wat het nut is van deze berekening. In dit geval bewijs gaat het om een normaalverdeling wat er op wijst dat de steekproeven niet auto-gecorreleerd zijn.
2008-11-03 19:17:16 [Nathalie Boden] [reply
2008-11-03 19:48:43 [Nathalie Boden] [reply
Hierbij zien we dat de student de juiste methode heeft gebruikt maar zo staat er niet vermeld dat de steekproeven onafhankelijk van elkaar moeten zijn en dat alle individuen de kans moeten hebben om in de steekproef terecht te komen. Ze moeten met andere woorden onafhankelijk zijn van elkaar. Zo willen we de eigenschap van de populatie meten aan de hand van deze steekproeven. Zo zien we ook dat er geen sprake is van autocorrelatie.
2008-11-03 20:17:29 [Nathalie Boden] [reply
In mijn vorige beoordeling van een andere student zie je het juiste resultaat dat de student moet bekomen: http://www.freestatistics.org/blog/index.php?v=date/2008/Nov/03/t1225735999b3d14khnwgk3qae.htm

Assumptie 1: we geven hier het aantal lags in namelijk 36. In de eerste lagplot gaan we het verband zoeken tussen het heden en het verleden omdat de periode van log x=k-1 vertraagt is met 1 periode. We zien hier dat de autocorrelatie bijna gelijk is aan 0 en maar lichtjes positief is. Autocorrelatie is de maatstaf die wordt aangegeven of puntenwolk op een rechte gelegen is. Bij de laagste lagplot zien we dat er een positieve seizonale autocorrelatie is. Zo zien we dat er maanden zijn waar er veel en weinig geproduceerd wordt. Zo kunnen we een voorspelling doen jaar naar jaar. Conclusie= de tijdreeks is niet random, maar ze bevat wel degelijk autocorrelatie naar seizonale autocorrelatie

Assumptie 2:We kijken hier naar het histogram hier zien we dat we min of meer een normale verdeling hebben. Zo kijken we ook naar de density plot (afgevlakte versie van het histogram). Hieruit kunnen we zien dat dit sterk lijkt op een normale verdeling. Ook op de normal q-q plot zien we op de verticale as de quantilen van deze reeks en op de horizontale as= de theoretische quantilen indien er een normale verdeling zou zijn. We zien hier dat de meeste punten vrij dicht op de lijn bevinden. Conclusie= we zitten vrij dicht bij een normale verdeling, ondanks er geen autocorrelatie is.

Assumptie 3: Je kan vermoeden dat op lange termijn de reeks niet constant is, maar het is zeer moeilijk om het op het zicht te zien. Daarom gaan we de methode van de central tendancy toepassen op deze reekst. We zien hier dat het gemiddelde dicht rond de 87 schommelt. We zien hier ook dat outliers geen invloed hebben. Conclusie= we vermoeden dat er een dalende tendens is op lange termijn.

Assumptie 4: Outliers hebben geen effect op het gemiddelde. Hier gaan we kijken naar 'run sequence plot'. We gaan kijken naar de spreiding van de reeks doorheen de tijd. Zo zien we dat het linker gedeelte harder schommelt dan het rechtergedeelte. Zo kunnen we in de r-code x <- x - .... (voorspelling van het gemiddelde) We zien hier in het resultaat dat het gemiddelde nu rond 0 ligt.
2008-11-03 20:44:03 [Kristof Francken] [reply
De student heeft inderdaad gelijk wanneer hij zegt dat de maximumcorrelatie zich bevindt bij een lamda 0,14. Hij/zij vermeldt er ook keurig bij dat we hier te maken hebben met een normaal-verdeling. De voorwaarden die nodig zijn om over een normaalverdeling te spreken vermeldt de persoon in kwestie echter niet. De voorwaarden zijn 1) De steekproeven moeten onafhankelijk zijn van elkaar 2) elke individu moeten de zelfde kans hebben om in de steekproef te zitten.

Post a new message
Dataseries X:
110,40
96,40
101,90
106,20
81,00
94,70
101,00
109,40
102,30
90,70
96,20
96,10
106,00
103,10
102,00
104,70
86,00
92,10
106,90
112,60
101,70
92,00
97,40
97,00
105,40
102,70
98,10
104,50
87,40
89,90
109,80
111,70
98,60
96,90
95,10
97,00
112,70
102,90
97,40
111,40
87,40
96,80
114,10
110,30
103,90
101,60
94,60
95,90
104,70
102,80
98,10
113,90
80,90
95,70
113,20
105,90
108,80
102,30
99,00
100,70
115,50




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19719&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19719&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19719&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24







Tukey Lambda - Key Values
Distribution (lambda)Correlation
Approx. Cauchy (lambda=-1)0.681034394717584
Exact Logistic (lambda=0)0.984820721672163
Approx. Normal (lambda=0.14)0.989505916159088
U-shaped (lambda=0.5)0.985385537255734
Exactly Uniform (lambda=1)0.97511352322751

\begin{tabular}{lllllllll}
\hline
Tukey Lambda - Key Values \tabularnewline
Distribution (lambda) & Correlation \tabularnewline
Approx. Cauchy (lambda=-1) & 0.681034394717584 \tabularnewline
Exact Logistic (lambda=0) & 0.984820721672163 \tabularnewline
Approx. Normal (lambda=0.14) & 0.989505916159088 \tabularnewline
U-shaped (lambda=0.5) & 0.985385537255734 \tabularnewline
Exactly Uniform (lambda=1) & 0.97511352322751 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=19719&T=1

[TABLE]
[ROW][C]Tukey Lambda - Key Values[/C][/ROW]
[ROW][C]Distribution (lambda)[/C][C]Correlation[/C][/ROW]
[ROW][C]Approx. Cauchy (lambda=-1)[/C][C]0.681034394717584[/C][/ROW]
[ROW][C]Exact Logistic (lambda=0)[/C][C]0.984820721672163[/C][/ROW]
[ROW][C]Approx. Normal (lambda=0.14)[/C][C]0.989505916159088[/C][/ROW]
[ROW][C]U-shaped (lambda=0.5)[/C][C]0.985385537255734[/C][/ROW]
[ROW][C]Exactly Uniform (lambda=1)[/C][C]0.97511352322751[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=19719&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=19719&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Tukey Lambda - Key Values
Distribution (lambda)Correlation
Approx. Cauchy (lambda=-1)0.681034394717584
Exact Logistic (lambda=0)0.984820721672163
Approx. Normal (lambda=0.14)0.989505916159088
U-shaped (lambda=0.5)0.985385537255734
Exactly Uniform (lambda=1)0.97511352322751



Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
gp <- function(lambda, p)
{
(p^lambda-(1-p)^lambda)/lambda
}
sortx <- sort(x)
c <- array(NA,dim=c(201))
for (i in 1:201)
{
if (i != 101) c[i] <- cor(gp(ppoints(x), lambda=(i-101)/100),sortx)
}
bitmap(file='test1.png')
plot((-100:100)/100,c[1:201],xlab='lambda',ylab='correlation',main='PPCC Plot - Tukey lambda')
grid()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Tukey Lambda - Key Values',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Distribution (lambda)',1,TRUE)
a<-table.element(a,'Correlation',1,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Approx. Cauchy (lambda=-1)',header=TRUE)
a<-table.element(a,c[1])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Exact Logistic (lambda=0)',header=TRUE)
a<-table.element(a,(c[100]+c[102])/2)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Approx. Normal (lambda=0.14)',header=TRUE)
a<-table.element(a,c[115])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'U-shaped (lambda=0.5)',header=TRUE)
a<-table.element(a,c[151])
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Exactly Uniform (lambda=1)',header=TRUE)
a<-table.element(a,c[201])
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')