Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_cloud.wasp

Title produced by software

Trivariate Scatterplots

Date of computation

Sun, 09 Nov 2008 09:39:36 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/09/t1226248891uuvxuygm6s3glkg.htm/, Retrieved Sun, 19 May 2024 10:07:47 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22775, Retrieved Sun, 19 May 2024 10:07:47 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

161

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Trivariate Scatterplots] [Trivariate Scater...] [2008-11-08 12:14:33] [82d201ca7b4e7cd2c6f885d29b5b6937]
F         [Trivariate Scatterplots] [trivariate scatte...] [2008-11-09 16:39:36] [d6e9f26c3644bfc30f06303d9993b878] [Current]

Feedback Forum

2008-11-14 10:35:46 [Ciska Tanghe] [reply] 
Hoe interpreteer je deze grafiek? 
Tip: bekijk de vierde grafiek, daar zie je duidelijker of er al dan niet een verband is tussen de variabelen.
2008-11-19 14:57:02 [Gregory Van Overmeiren] [reply] 
Een groot nadeel bij trivariate scatterplots is dat het niet eenvoudig is om een patroon te zien omdat een 3D kubus wordt geprojecteerd op een 2D scherm. => Dit zorgt voor een vertekend beeld. 2 punten die precies net achter elkaar liggen kunnen in werkelijkheid op een grote afstand van elkaar liggen!
2008-11-19 15:08:28 [Gregory Van Overmeiren] [reply] 
We zien dat de cluster hierarchisch is opgebouwd. Alle observaties vallen uit elkaar in verschillende groepen. 
2008-11-20 09:51:32 [An De Koninck] [reply] 
De trivariate scatterplot is een driedimensionale grafiek, en dus moeilijk te interpreteren. 
Als je echter kijkt naar de linker-binnenhoek van de kubus zie je dat de meeste punten daar gecentraliseerd zijn. 
2008-11-21 18:31:04 [Michael Van Spaandonck] [reply] 
Het interpreteren van een driedimensionale grafiek op een tweedimensionaal vlak is inderdaad erg moeijlijk en daarom ook niet aan te raden vanwege de vertekening die het teweeg brengt. Daarom zullen de eerste drie grafieken niet worden besproken. 
 
De vierde grafiek geeft door middel van histogrammen op de diagonaal de verschillende verdelingen van de reeksen weer, met daaromheen correlaties tussen verschillende reeksen in scatterplotvorm. 
 
Tot slot worden er 3 Bivariate Kernell Density plots weergegeven. Hier gaat men het scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte. 
Een voorbeeldinterpretatie van een dergelijke grafiek vind je hier: 
http://www.freestatistics.org/index.php?action=16
2008-11-23 21:53:27 [Isabel Wilms] [reply] 
Trivariate scatterplots: op deze 3D-kubussen is het moeilijk om een verband af te lezen. op de 2D-scatterplot kunnen we dit wel,deze lees je gewoon hetzelfde af als anders. Maar deze geeft ook een vertekend beeld. Hier zien we dus een normaalverdeling. 
2008-11-24 15:45:53 [Bernard Femont] [reply] 
Een groot nadeel bij trivariate scatterplots is dat het niet eenvoudig is om een patroon te zien omdat een 3D kubus wordt geprojecteerd op een 2D scherm. => Dit zorgt voor een vertekend beeld. Daarom zullen de eerste drie grafieken niet worden besproken.Als je echter kijkt naar de linker-binnenhoek van de kubus zie je dat de meeste punten daar gecentraliseerd zijn. tot slot hebben we de Bivariate Kernell Density plots. Hier gaat men het scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte.
2008-11-24 15:46:00 [Bernard Femont] [reply] 
Een groot nadeel bij trivariate scatterplots is dat het niet eenvoudig is om een patroon te zien omdat een 3D kubus wordt geprojecteerd op een 2D scherm. => Dit zorgt voor een vertekend beeld. Daarom zullen de eerste drie grafieken niet worden besproken.Als je echter kijkt naar de linker-binnenhoek van de kubus zie je dat de meeste punten daar gecentraliseerd zijn. tot slot hebben we de Bivariate Kernell Density plots. Hier gaat men het scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte.
2008-11-24 19:30:39 [Koen Van den Heuvel] [reply] 
Er werd geen conclusie getrokken uit de grafiek. 
Een Trivariate scatterplot gaat 3 reeksen voorstellen door ze uit te zetten op een grafiek met 3-assen en zo dus een derde dimensie toe te voegen. 
De software stelt deze grafiek uit een aantal oogpunten voor, maar doordat het nog steeds in 2d weergegeven moet worden, ontstaat er vertekening doordat punten die achter elkaar liggen niet duidelijk kunnen worden onderscheiden. 
Deze vertekening is er ook in de matrix met van scatterplots die de 3d-grafiek op 2d projecteren. 
Daarom worden ook Bivariate Kernel Density-plots toegevoegd waardoor de dichtheid en clusters veel beter kunnen worden afgelezen.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Dataseries Z:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	6 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 6 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22775&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]6 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22775&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22775&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	6 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Belgi� ; par6 = Vlaanderen ; par7 = Walloni� ;

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Belgi� ; par6 = Vlaanderen ; par7 = Walloni� ; par8 = ; par9 = ; par10 = ; par11 = ; par12 = ; par13 = ; par14 = ; par15 = ; par16 = ; par17 = ; par18 = ; par19 = ; par20 = ;

R code (references can be found in the software module):

x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code