Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_boxcoxnorm.wasp
Title produced by softwareBox-Cox Normality Plot
Date of computationWed, 12 Nov 2008 13:38:16 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/12/t1226522402h28i1qdmlbzfk3o.htm/, Retrieved Sun, 19 May 2024 08:46:12 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24442, Retrieved Sun, 19 May 2024 08:46:12 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact147
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Box-Cox Normality Plot] [various EDA topic...] [2008-11-12 20:38:16] [821c4b3d195be8e737cf8c9dc649d3cf] [Current]
Feedback Forum
2008-11-17 14:19:25 [Stefan Temmerman] [reply
De student voert de berekening van de Box-Cox normality plot correct uit. Hier merken we na de transformatie met de waarde lambda, een betere normaalverdeling. Deze zorgt voor onder andere een kleinere standaarddeviatie, zoals vermeld in Q3.
2008-11-19 16:54:42 [Carole Thielens] [reply
De student maakte correcte berekeningen, maar was in zijn uitleg wel veel te beperkt. Extra uitleg is hier dus vereist...

Een Box-cox transformatie kan leiden tot een meer uitgesproken normaalverdeling. Zo kunnen statistische technieken toegepast worden op de gegevens die gebaseerd zijn op de veronderstelling dat er sprake is van een normaalverdeling. Op de verticale as van de Box-cox normality plot wordt de correlatiecoëfficiënt na transformatie weergegeven, terwijl lambda op de x-as staat.

Uit deze transformatie wordt zowel uit het histogram duidelijk dat de oorspronkelijk linksscheve verdeling meer evolueerde naar een rechtsscheve verdeling. Er onstaat hierbij wel een iets sterkere normaalverdeling, maar het verschil is niet erg markant.

Eveneens vergat de student QQ plots bij zijn analyse toe te voegen. Deze vormen immers ook een mooi beeld van het effect van de transformatie.
2008-11-22 14:32:05 [Angelique Van de Vijver] [reply
Goede berekeningen van de student, maar onvolledige conclusies. Na de transformatie zijn de gegevens iets normaler verdeeld, maar dit verschil is zeer klein.
Student heeft de normal Q-Qplots niet besproken. Je kan een zeer kleine wijziging vaststellen op de normal Q-Q plots, waarbij de puntenwolk van de getransformeerde data iets meer rond de diagonaal liggen dan de puntenwolk van de originele data. Deze verschillen zijn zodanig klein dat de transformatie weinig zin heeft.
2008-11-23 10:59:41 [Gert-Jan Geudens] [reply
Correcte berekening van de student , maar de uitleg is niet helemaal correct. Na de transformatie naar een normaalverdeling via een optimale lambda van -2, merken we da gegevens nog steeds niet echt normaal verdeeld zijn en dat de transformatie hier echter geen zin of zeer weinig zin heeft.
2008-11-25 00:18:59 [Jessica Alves Pires] [reply
Juiste berekening, beperkte uitleg. Ik ben het eens met Angelique. De Normal QQ-plot is naar mijn mening duidelijker en kan je daaruit makkelijker conclusies trekken. Deze staan wel hieronder op deze link maar niet in het Word document. De punten liggen ongeveer op de diagonaal waardoor men kan besluiten dat de gegevens min of meer normaal verdeeld zijn. De transformatie zorgt inderdaad niet voor veel verschil.

Post a new message
Dataseries X:
156,4
143,1
148,9
134
118
125,3
138
114
109,9
151,5
129,1
121,7
126,1
114,3
124,7
111,9
120
119,5
137,8
105,4
135,4
182,5
129,6
147,5
128,9
119,7
149,4
136,6
118,6
121,4
138,9
109,5
131,7
160,3
138,1
136,7
126,6
138
152
137
134,9
154,4
145,2
133,1
169,6
159,3
124,9
138,1
162,5
136,6
148,1
142
137,9
152,5
182,8
135,3
141,8
151,7
140,6
128




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24442&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24442&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24442&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Box-Cox Normality Plot
# observations x60
maximum correlation0.308062390684109
optimal lambda-2

\begin{tabular}{lllllllll}
\hline
Box-Cox Normality Plot \tabularnewline
# observations x & 60 \tabularnewline
maximum correlation & 0.308062390684109 \tabularnewline
optimal lambda & -2 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24442&T=1

[TABLE]
[ROW][C]Box-Cox Normality Plot[/C][/ROW]
[ROW][C]# observations x[/C][C]60[/C][/ROW]
[ROW][C]maximum correlation[/C][C]0.308062390684109[/C][/ROW]
[ROW][C]optimal lambda[/C][C]-2[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24442&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24442&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Box-Cox Normality Plot
# observations x60
maximum correlation0.308062390684109
optimal lambda-2



Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
n <- length(x)
c <- array(NA,dim=c(401))
l <- array(NA,dim=c(401))
mx <- 0
mxli <- -999
for (i in 1:401)
{
l[i] <- (i-201)/100
if (l[i] != 0)
{
x1 <- (x^l[i] - 1) / l[i]
} else {
x1 <- log(x)
}
c[i] <- cor(qnorm(ppoints(x), mean=0, sd=1),x1)
if (mx < c[i])
{
mx <- c[i]
mxli <- l[i]
}
}
c
mx
mxli
if (mxli != 0)
{
x1 <- (x^mxli - 1) / mxli
} else {
x1 <- log(x)
}
bitmap(file='test1.png')
plot(l,c,main='Box-Cox Normality Plot',xlab='Lambda',ylab='correlation')
mtext(paste('Optimal Lambda =',mxli))
grid()
dev.off()
bitmap(file='test2.png')
hist(x,main='Histogram of Original Data',xlab='X',ylab='frequency')
grid()
dev.off()
bitmap(file='test3.png')
hist(x1,main='Histogram of Transformed Data',xlab='X',ylab='frequency')
grid()
dev.off()
bitmap(file='test4.png')
qqnorm(x)
qqline(x)
grid()
mtext('Original Data')
dev.off()
bitmap(file='test5.png')
qqnorm(x1)
qqline(x1)
grid()
mtext('Transformed Data')
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Box-Cox Normality Plot',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations x',header=TRUE)
a<-table.element(a,n)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum correlation',header=TRUE)
a<-table.element(a,mx)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'optimal lambda',header=TRUE)
a<-table.element(a,mxli)
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')