Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_boxcoxnorm.wasp
Title produced by softwareBox-Cox Normality Plot
Date of computationTue, 11 Nov 2008 13:04:58 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/11/t1226433922d8wsb6oqm0t2gjg.htm/, Retrieved Wed, 15 May 2024 21:00:30 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=23917, Retrieved Wed, 15 May 2024 21:00:30 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact171
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
-     [Bivariate Kernel Density Estimation] [Q1 Bivariate Dens...] [2007-11-03 14:50:57] [e2ec4dc832988c648c062d4cdc574d44]
- RMPD  [Hierarchical Clustering] [WS4 Q2 dendrogram] [2007-11-05 10:02:49] [74be16979710d4c4e7c6647856088456]
- RMPD    [Box-Cox Normality Plot] [various eda topic...] [2008-11-04 20:30:40] [077ffec662d24c06be4c491541a44245]
F    D      [Box-Cox Normality Plot] [various eda topic...] [2008-11-04 20:48:12] [077ffec662d24c06be4c491541a44245]
F   P         [Box-Cox Normality Plot] [Box-Cox Normality...] [2008-11-11 16:08:06] [73d6180dc45497329efd1b6934a84aba]
F               [Box-Cox Normality Plot] [Box-Cox Normality...] [2008-11-11 17:40:11] [6816386b1f3c2f6c0c9f2aa1e5bc9362]
F                   [Box-Cox Normality Plot] [] [2008-11-11 20:04:58] [81dc0ee785f23261ccd6abf7aef76c2a] [Current]
Feedback Forum
2008-11-20 19:33:56 [Olivier Uyttendaele] [reply
Dezelfde uitleg als bij het vorige Box Cox Plot.
Er is inderdaad zo goed als geen verschil tussen de 2 grafieken. Algemeen kan je zeggen dat het Box Cox Linearity Plot een manier is om tijdreeksen goed en snel te transformeren. Bedoeling is te onderzoeken of er een lambda parameter bestaat zodanig je een lineair verband krijgt.

In de R-code wordt een nieuwe variabele gecreëerd nl. x1. Deze x1 is eigenlijk de oorspronkelijke variabele x verheven tot de macht lambda -1 en dit dan opnieuw gedeeld door lambda. Hierdoor transformeer je dus de tijdreeks. Je moet op zoek gaan naar de optimale lambda om de tijdreeks te transformeren. De optimale lambda hier is 0.57.

Grafisch kan je in de grafiek zien. Als je in de grafiek naar het maximum van de rechte kijkt, moet je op die waarde de lambda nemen. Concluderend kan je zeggen dat een Box Cox Plot je een antwoord kan geven op; 1) is een transformatie aangewezen de reeks? 2) Wat is de beste waarde voor de transformatie parameter?

Specifiek bij deze kan je eventueel de R code aanpassen omdat we ons kunnen vergissen betreffende het maximum (bij de grafiek). Als je de correlatie kan verkleinen, kan je eenvoudiger het maximum zien.
2008-11-23 10:27:19 [Inge Meelberghs] [reply
Hier kunnen we inderdaad hetzelfde besluit trekken als voorgaande vraag.

Als we kijken naar de grafiek van de originele data en de grafiek van de getransformeerde data kunnen we zeggen dat er praktisch geen verschil te zien is.

Op de Box - Cox Linearity Plot kunnen we ziet dat er zich een maximum voordoet. We veronderstellen dus dat er zich een transformatie heeft voorgedaan. Met deze transformatie proberen we een niet lineaire scatterplot toch lineair te maken door een geschikte lambda waarde te kiezen. Hierdoor veranderd de R-code en wordt er een nieuwe variabele gecreëerd. In dit geval bedraagt de optimale lambda waarde 0,57. Toch zien we na de transformatie weinig tot geen verschil zoals eerder al vermeld is. Bijkomend in deze normality plot zijn de hisogrammen. Hieruit kunnen we afleiden of er al dan niet sprake is van een noramaalverdeling wat in dit geval wel is.
2008-11-23 10:56:32 [Bonifer Spillemaeckers] [reply
Hier kunnen we hetzelfde besluiten als bij vraag 3.

Post a new message
Dataseries X:
12300.00
12092.80
12380.80
12196.90
9455.00
13168.00
13427.90
11980.50
11884.80
11691.70
12233.80
14341.40
13130.70
12421.10
14285.80
12864.60
11160.20
14316.20
14388.70
14013.90
13419.00
12769.60
13315.50
15332.90
14243.00
13824.40
14962.90
13202.90
12199.00
15508.90
14199.80
15169.60
14058.00
13786.20
14147.90
16541.70
13587.50
15582.40
15802.80
14130.50
12923.20
15612.20
16033.70
16036.60
14037.80
15330.60
15038.30
17401.80
14992.50
16043.70
16929.60
15921.30
14417.20
15961.00
17851.90
16483.90
14215.50
17429.70
17839.50
17629.20




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=23917&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=23917&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=23917&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Box-Cox Normality Plot
# observations x60
maximum correlation0.803824455609926
optimal lambda2

\begin{tabular}{lllllllll}
\hline
Box-Cox Normality Plot \tabularnewline
# observations x & 60 \tabularnewline
maximum correlation & 0.803824455609926 \tabularnewline
optimal lambda & 2 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=23917&T=1

[TABLE]
[ROW][C]Box-Cox Normality Plot[/C][/ROW]
[ROW][C]# observations x[/C][C]60[/C][/ROW]
[ROW][C]maximum correlation[/C][C]0.803824455609926[/C][/ROW]
[ROW][C]optimal lambda[/C][C]2[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=23917&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=23917&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Box-Cox Normality Plot
# observations x60
maximum correlation0.803824455609926
optimal lambda2



Parameters (Session):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = uitvoer Vlaanderen ; par6 = uitvoer Belgie naar landen buiten EU ; par7 = uitvoer Belgie (totaal) ;
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = uitvoer Vlaanderen ; par6 = uitvoer Belgie naar landen buiten EU ; par7 = uitvoer Belgie (totaal) ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;
R code (references can be found in the software module):
n <- length(x)
c <- array(NA,dim=c(401))
l <- array(NA,dim=c(401))
mx <- 0
mxli <- -999
for (i in 1:401)
{
l[i] <- (i-201)/100
if (l[i] != 0)
{
x1 <- (x^l[i] - 1) / l[i]
} else {
x1 <- log(x)
}
c[i] <- cor(qnorm(ppoints(x), mean=0, sd=1),x1)
if (mx < c[i])
{
mx <- c[i]
mxli <- l[i]
}
}
c
mx
mxli
if (mxli != 0)
{
x1 <- (x^mxli - 1) / mxli
} else {
x1 <- log(x)
}
bitmap(file='test1.png')
plot(l,c,main='Box-Cox Normality Plot',xlab='Lambda',ylab='correlation')
mtext(paste('Optimal Lambda =',mxli))
grid()
dev.off()
bitmap(file='test2.png')
hist(x,main='Histogram of Original Data',xlab='X',ylab='frequency')
grid()
dev.off()
bitmap(file='test3.png')
hist(x1,main='Histogram of Transformed Data',xlab='X',ylab='frequency')
grid()
dev.off()
bitmap(file='test4.png')
qqnorm(x)
qqline(x)
grid()
mtext('Original Data')
dev.off()
bitmap(file='test5.png')
qqnorm(x1)
qqline(x1)
grid()
mtext('Transformed Data')
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Box-Cox Normality Plot',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations x',header=TRUE)
a<-table.element(a,n)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum correlation',header=TRUE)
a<-table.element(a,mx)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'optimal lambda',header=TRUE)
a<-table.element(a,mxli)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')