Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_boxcoxlin.wasp
Title produced by softwareBox-Cox Linearity Plot
Date of computationThu, 13 Nov 2008 15:41:16 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/13/t1226616106q6zisc4pocfqy5r.htm/, Retrieved Sun, 19 May 2024 10:08:17 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24875, Retrieved Sun, 19 May 2024 10:08:17 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact145
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
-     [Bivariate Kernel Density Estimation] [Bel20 en Downjones] [2008-11-12 17:23:23] [74be16979710d4c4e7c6647856088456]
F RMPD  [Maximum-likelihood Fitting - Normal Distribution] [kelly] [2008-11-12 17:58:06] [74be16979710d4c4e7c6647856088456]
F RMPD      [Box-Cox Linearity Plot] [box cox linearity...] [2008-11-13 22:41:16] [c8dc05b1cdf5010d9a4f2d773adefb82] [Current]
Feedback Forum
2008-11-16 11:24:37 [Nicolaj Wuyts] [reply
De Box-Cox linearity plot veranderd niet veel aan de relatie tussen de gegevens. Als je de curves bekijkt van de data voor en na de transformatie, zie je tweemaal ongeveer dezelfde curve die recht uit de oorsprong vertrekt. Ook alle punten liggen mooi op deze curve. We kunnen dus besluiten da de Box-Cox linearity plot geen nut heeft gehad.
2008-11-23 13:44:04 [c97d2ae59c98cf77a04815c1edffab5a] [reply
de grafiek is juist, maar er is geen conclusie gevormd.
enige uitleg:
De box-Cox linearity plot is een plot van de correlatie tussen Y en de getransformeerde X voor bepaalde waarden van lambda . Namelijk: lambda is de coördinaat voor de variabele van de horizontale, en de waarde van de correlatie tussen Y en de getransformeerde X is de coördinaat voor de verticaal as van de plot.
De optimale waarde van lambda is dan die waarde die overeenstemt met de maximum correlatie (of het minimum voor een negatieve correlatie) op de plot. We kunnen hieruit concluderen dat het omzetten/transformeren van X wordt gebruikt om het verband (tussen Y en X) te verbeteren. we moeten hierbij wel nagaan of de grafiek na het maximum nog zou stijgen of niet. is dit wel het geval(bij een rechte) dan kunnen we stellen dat er nog geen maximum correlatie bereikt is wanneer lambda varieert tussen -2 en 2. in dit geva zou onze moeite dus nutteloos geweest zijn.
de conclusie mbt deze tijdsreeks:
We kunnen stellen dat lamba voor de waarde 1 een maximum correlatie van 1 kan verwezenlijken, waardoor er een perfect positief lineair verband ontstaat.we zijn dus in onze opzet geslaagd.
2008-11-24 10:37:28 [Julian De Ruyter] [reply
Geen conclusie bij de figuur gegeven door de student.
De box-cox lineairity plot probeert een variabele X te transformeren zodat het effect van correlatie hierdoor tussen 2variabelen hopelijk verhoogt wordt.
X-as = lamdba en Y-as is de correlatie tussen getransformeerde x en originele y.
Na transformatie ging de standaard deviatie van 2 naar 9 maar aan de correlatie zien we echter geen verandering. De gegevens blijven min of meer hetzelfde verdeeld. De transformatie heeft met andere woorden niet veel uitgehaald...
De box-Cox linearity plot behaald in waarde lamdba 1 een maximum en uit de grafiek is vrij goed af te leiden dat deze functie niet meer zal stijgen.
2008-11-24 20:03:17 [Liese Drijkoningen] [reply
Ook hier werd geen conclusie gegeven.
Het box-cox linearity plot probeert 2 variabelen met elkaar in verband te brengen d.m.v. scatterplots.
Deze module transformeert de variabelen zodat de scatterplots lineair worden.
De vraag die we ons dan moeten stellen is ofdat we na de transformatie een maximum hebben bereikt. Dit kunnen we onderzoeken aan de hand van de parabool. We weten dat het box-cox linearity plot tot -2 loopt, dus is de vraag of dit de optimale waarde is. In dit geval denk ik dat dat niet het geval is. De lijn vertoont de vorm van een soort parabool. Dit kan erop wijzen dat het maximum bereikt is in 1. De grafiek zal dus niet meer verder stijgen.
2008-11-24 21:09:28 [Jonas Scheltjens] [reply
Q3: De student geeft geen uitleg over de bekomen Box-Cox linearity plot. We zien dat de lijn van de Box-Cox linearity plot in stijgende lijn omhoog gaat. De reden waarom men een Box-Cox linearity plot gebruikt is omdat men zo 2 variabelen in eenzelfde scatterplot in verband kan brengen. Ook is het de bedoeling om de gegevens in wetmatigheden tracht vast te leggen in een lijn, of rechte. Dit noemt men dan ook een Box-Cox transformatie. Het doel hiervan is om een zo goed mogelijke voorspelling te kunnen maken. De correlatie wordt niet beïnvloed door de transformatie maar heeft als doel de lineair fit rechter (meer lineair) te maken). Hierbij laat men de Lambda schommelen (in waarde) probeert men alle mogelijke transformaties uit. Dit geeft in de meeste gevallen een curve waarin we een maximum kunnen terugvinden. De X-waarde (en de optmiale Lambda) die het maximum weergeeft is die waarde die de rechte het beste benaderd. Hier is de transformatie echter niet nuttig aangezien er visueel niet echt veel veranderd.

Post a new message
Dataseries X:
10165
269
708
1362
2271
3516
4775
6334
6150
7794
8851
9721
9676
402
1046
1743
2711
3817
4128
5505
4921
6091
7263
8035
7828
296
500
1134
2061
2737
2959
4113
3494
4518
5470
5664
4717
606
615
1062
983
340
467
1580
804
1709
2335
2832
2582
Dataseries Y:
10165
269
708
1362
2271
3516
4775
6334
6150
7794
8851
9721
9676
402
1046
1743
2711
3817
4128
5505
4921
6091
7263
8035
7828
296
500
1134
2061
2737
2959
4113
3494
4518
5470
5664
4717
606
615
1062
983
340
467
1580
804
1709
2335
2832
2582




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24875&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24875&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24875&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Box-Cox Linearity Plot
# observations x49
maximum correlation1
optimal lambda(x)1
Residual SD (orginial)2.02171676597160e-12
Residual SD (transformed)9.20749911933039e-13

\begin{tabular}{lllllllll}
\hline
Box-Cox Linearity Plot \tabularnewline
# observations x & 49 \tabularnewline
maximum correlation & 1 \tabularnewline
optimal lambda(x) & 1 \tabularnewline
Residual SD (orginial) & 2.02171676597160e-12 \tabularnewline
Residual SD (transformed) & 9.20749911933039e-13 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24875&T=1

[TABLE]
[ROW][C]Box-Cox Linearity Plot[/C][/ROW]
[ROW][C]# observations x[/C][C]49[/C][/ROW]
[ROW][C]maximum correlation[/C][C]1[/C][/ROW]
[ROW][C]optimal lambda(x)[/C][C]1[/C][/ROW]
[ROW][C]Residual SD (orginial)[/C][C]2.02171676597160e-12[/C][/ROW]
[ROW][C]Residual SD (transformed)[/C][C]9.20749911933039e-13[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24875&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24875&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Box-Cox Linearity Plot
# observations x49
maximum correlation1
optimal lambda(x)1
Residual SD (orginial)2.02171676597160e-12
Residual SD (transformed)9.20749911933039e-13



Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
n <- length(x)
c <- array(NA,dim=c(401))
l <- array(NA,dim=c(401))
mx <- 0
mxli <- -999
for (i in 1:401)
{
l[i] <- (i-201)/100
if (l[i] != 0)
{
x1 <- (x^l[i] - 1) / l[i]
} else {
x1 <- log(x)
}
c[i] <- cor(x1,y)
if (mx < abs(c[i]))
{
mx <- abs(c[i])
mxli <- l[i]
}
}
c
mx
mxli
if (mxli != 0)
{
x1 <- (x^mxli - 1) / mxli
} else {
x1 <- log(x)
}
r<-lm(y~x)
se <- sqrt(var(r$residuals))
r1 <- lm(y~x1)
se1 <- sqrt(var(r1$residuals))
bitmap(file='test1.png')
plot(l,c,main='Box-Cox Linearity Plot',xlab='Lambda',ylab='correlation')
grid()
dev.off()
bitmap(file='test2.png')
plot(x,y,main='Linear Fit of Original Data',xlab='x',ylab='y')
abline(r)
grid()
mtext(paste('Residual Standard Deviation = ',se))
dev.off()
bitmap(file='test3.png')
plot(x1,y,main='Linear Fit of Transformed Data',xlab='x',ylab='y')
abline(r1)
grid()
mtext(paste('Residual Standard Deviation = ',se1))
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Box-Cox Linearity Plot',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations x',header=TRUE)
a<-table.element(a,n)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum correlation',header=TRUE)
a<-table.element(a,mx)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'optimal lambda(x)',header=TRUE)
a<-table.element(a,mxli)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (orginial)',header=TRUE)
a<-table.element(a,se)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (transformed)',header=TRUE)
a<-table.element(a,se1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')