Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*Unverified author*

R Software Module

rwasp_boxcoxlin.wasp

Title produced by software

Box-Cox Linearity Plot

Date of computation

Thu, 13 Nov 2008 15:41:16 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/13/t1226616106q6zisc4pocfqy5r.htm/, Retrieved Sun, 19 May 2024 10:08:17 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24875, Retrieved Sun, 19 May 2024 10:08:17 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

145

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

-     [Bivariate Kernel Density Estimation] [Bel20 en Downjones] [2008-11-12 17:23:23] [74be16979710d4c4e7c6647856088456]
F RMPD  [Maximum-likelihood Fitting - Normal Distribution] [kelly] [2008-11-12 17:58:06] [74be16979710d4c4e7c6647856088456]
F RMPD      [Box-Cox Linearity Plot] [box cox linearity...] [2008-11-13 22:41:16] [c8dc05b1cdf5010d9a4f2d773adefb82] [Current]

Feedback Forum

2008-11-16 11:24:37 [Nicolaj Wuyts] [reply] 
De Box-Cox linearity plot veranderd niet veel aan de relatie tussen de gegevens. Als je de curves bekijkt van de data voor en na de transformatie, zie je tweemaal ongeveer dezelfde curve die recht uit de oorsprong vertrekt. Ook alle punten liggen mooi op deze curve. We kunnen dus besluiten da de Box-Cox linearity plot geen nut heeft gehad.
2008-11-23 13:44:04 [c97d2ae59c98cf77a04815c1edffab5a] [reply] 
de grafiek is juist, maar er is geen conclusie gevormd. 
enige uitleg:  
De box-Cox linearity plot is een plot van de correlatie tussen Y en de getransformeerde X voor bepaalde waarden van lambda . Namelijk: lambda is de coördinaat voor de variabele van de horizontale, en de waarde van de correlatie tussen Y en de getransformeerde X is de coördinaat voor de verticaal as van de plot.  
De optimale waarde van lambda is dan die waarde die overeenstemt met de maximum correlatie (of het minimum voor een negatieve correlatie) op de plot. We kunnen hieruit concluderen dat het omzetten/transformeren van X wordt gebruikt om het verband (tussen Y en X) te verbeteren. we moeten hierbij wel nagaan of de grafiek na het maximum nog zou stijgen of niet. is dit wel het geval(bij een rechte) dan kunnen we stellen dat er nog geen maximum correlatie bereikt is wanneer lambda varieert tussen -2 en 2. in dit geva zou onze moeite dus nutteloos geweest zijn. 
de conclusie mbt deze tijdsreeks: 
We kunnen stellen dat lamba voor de waarde 1 een maximum correlatie van 1 kan verwezenlijken, waardoor er een perfect positief lineair verband ontstaat.we zijn dus in onze opzet geslaagd. 
2008-11-24 10:37:28 [Julian De Ruyter] [reply] 
Geen conclusie bij de figuur gegeven door de student. 
De box-cox lineairity plot probeert een variabele X te transformeren zodat het effect van correlatie hierdoor tussen 2variabelen hopelijk verhoogt wordt. 
X-as = lamdba en Y-as is de correlatie tussen getransformeerde x en originele y. 
Na transformatie ging de standaard deviatie van 2 naar 9 maar aan de correlatie zien we echter geen verandering. De gegevens blijven min of meer hetzelfde verdeeld. De transformatie heeft met andere woorden niet veel uitgehaald... 
De box-Cox linearity plot behaald in waarde lamdba 1 een maximum en uit de grafiek is vrij goed af te leiden dat deze functie niet meer zal stijgen.
2008-11-24 20:03:17 [Liese Drijkoningen] [reply] 
Ook hier werd geen conclusie gegeven. 
Het box-cox linearity plot probeert 2 variabelen met elkaar in verband te brengen d.m.v. scatterplots. 
Deze module transformeert de variabelen zodat de scatterplots lineair worden. 
De vraag die we ons dan moeten stellen is ofdat we na de transformatie een maximum hebben bereikt. Dit kunnen we onderzoeken aan de hand van de parabool. We weten dat het box-cox linearity plot tot -2 loopt, dus is de vraag of dit de optimale waarde is. In dit geval denk ik dat dat niet het geval is. De lijn vertoont de vorm van een soort parabool. Dit kan erop wijzen dat het maximum bereikt is in 1. De grafiek zal dus niet meer verder stijgen.
2008-11-24 21:09:28 [Jonas Scheltjens] [reply] 
Q3: De student geeft geen uitleg over de bekomen Box-Cox linearity plot. We zien dat de lijn van de Box-Cox linearity plot in stijgende lijn omhoog gaat. De reden waarom men een Box-Cox linearity plot gebruikt is omdat men zo 2 variabelen in eenzelfde scatterplot in verband kan brengen. Ook is het de bedoeling om de gegevens in wetmatigheden tracht vast te leggen in een lijn, of rechte. Dit noemt men dan ook een Box-Cox transformatie. Het doel hiervan is om een zo goed mogelijke voorspelling te kunnen maken. De correlatie wordt niet beïnvloed door de transformatie maar heeft als doel de lineair fit rechter (meer lineair) te maken). Hierbij laat men de Lambda schommelen (in waarde) probeert men alle mogelijke transformaties uit. Dit geeft in de meeste gevallen een curve waarin we een maximum kunnen terugvinden. De X-waarde (en de optmiale Lambda) die het maximum weergeeft is die waarde die de rechte het beste benaderd. Hier is de transformatie echter niet nuttig aangezien er visueel niet echt veel veranderd.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24875&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24875&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24875&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Box-Cox Linearity Plot
# observations x	49
maximum correlation	1
optimal lambda(x)	1
Residual SD (orginial)	2.02171676597160e-12
Residual SD (transformed)	9.20749911933039e-13

\begin{tabular}{lllllllll}
\hline
Box-Cox Linearity Plot \tabularnewline
# observations x & 49 \tabularnewline
maximum correlation & 1 \tabularnewline
optimal lambda(x) & 1 \tabularnewline
Residual SD (orginial) & 2.02171676597160e-12 \tabularnewline
Residual SD (transformed) & 9.20749911933039e-13 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24875&T=1

[TABLE]
[ROW][C]Box-Cox Linearity Plot[/C][/ROW]
[ROW][C]# observations x[/C][C]49[/C][/ROW]
[ROW][C]maximum correlation[/C][C]1[/C][/ROW]
[ROW][C]optimal lambda(x)[/C][C]1[/C][/ROW]
[ROW][C]Residual SD (orginial)[/C][C]2.02171676597160e-12[/C][/ROW]
[ROW][C]Residual SD (transformed)[/C][C]9.20749911933039e-13[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24875&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24875&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Box-Cox Linearity Plot
# observations x	49
maximum correlation	1
optimal lambda(x)	1
Residual SD (orginial)	2.02171676597160e-12
Residual SD (transformed)	9.20749911933039e-13

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Parameters (Session):

Parameters (R input):

R code (references can be found in the software module):

n <- length(x)
c <- array(NA,dim=c(401))
l <- array(NA,dim=c(401))
mx <- 0
mxli <- -999
for (i in 1:401)
{
l[i] <- (i-201)/100
if (l[i] != 0)
{
x1 <- (x^l[i] - 1) / l[i]
} else {
x1 <- log(x)
}
c[i] <- cor(x1,y)
if (mx < abs(c[i]))
{
mx <- abs(c[i])
mxli <- l[i]
}
}
c
mx
mxli
if (mxli != 0)
{
x1 <- (x^mxli - 1) / mxli
} else {
x1 <- log(x)
}
r<-lm(y~x)
se <- sqrt(var(r$residuals))
r1 <- lm(y~x1)
se1 <- sqrt(var(r1$residuals))
bitmap(file='test1.png')
plot(l,c,main='Box-Cox Linearity Plot',xlab='Lambda',ylab='correlation')
grid()
dev.off()
bitmap(file='test2.png')
plot(x,y,main='Linear Fit of Original Data',xlab='x',ylab='y')
abline(r)
grid()
mtext(paste('Residual Standard Deviation = ',se))
dev.off()
bitmap(file='test3.png')
plot(x1,y,main='Linear Fit of Transformed Data',xlab='x',ylab='y')
abline(r1)
grid()
mtext(paste('Residual Standard Deviation = ',se1))
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Box-Cox Linearity Plot',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations x',header=TRUE)
a<-table.element(a,n)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum correlation',header=TRUE)
a<-table.element(a,mx)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'optimal lambda(x)',header=TRUE)
a<-table.element(a,mxli)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (orginial)',header=TRUE)
a<-table.element(a,se)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Residual SD (transformed)',header=TRUE)
a<-table.element(a,se1)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code