Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_cloud.wasp

Title produced by software

Trivariate Scatterplots

Date of computation

Tue, 11 Nov 2008 08:06:59 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/11/t1226416076o0064z0dr9agbws.htm/, Retrieved Sun, 19 May 2024 10:42:51 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=23570, Retrieved Sun, 19 May 2024 10:42:51 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

161

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Trivariate Scatterplots] [Q1 triv scat] [2008-11-11 15:06:59] [e11d930c9e2984715c66c796cf63ef19] [Current]

Feedback Forum

2008-11-16 15:09:44 [Jan Van Riet] [reply] 
Het grote probleem bij trivariate correlatie is dat er altijd een zekere vertekening optreedt (bij elke invalshoek). 2 punten die op de 3D-grafiek dichtbij liggen, kunnen in werkelijkheid ver uit mekaar liggen.  
Ook de tweedimensionale scatterplot geeft dit vertekend beeld.  
Enkel de bivariate scatter plot is bruikbaar en nuttig om zaken uit af te leiden. Het bevat hoogtelijnen die punten van gelijke dichtheid met mekaar verbinden. Deze scatterplot geeft ook veel meer info dan de andere plots. Zodoende is dit veruit de beste grafiek om te gaan beslissen of er een verband is of niet.
2008-11-21 15:11:05 [Matthieu Blondeau] [reply] 
De student geeft hier een correcte interpretatie van de grafieken weer. De Bivariate en de Trivariate geven een duidelijk overzicht tussen het verband van 2 variabelen. 
Het voordeel van deze grafieken is dat je verschillende variabelen met mekaar kan vergelijken, je kan de invloed van één of andere variabelen onderzoeken. 
Het nadeel is dan dat in de 3D mode je een vertekend beeld krijgt.
2008-11-22 11:24:36 [Wim Golsteyn] [reply] 
Er is duidelijk een sterk verband tussen het Vlaams en het Waals gewest, en een minder sterk verband tussen deze gewesten en Brussel. Dit komt natuurlijk doordat Brussel proportioneel sterk verschilt in grootte, maar indien we focussen op de grootste clusters in de correlatie tussen Brussel en de andere 2 gewesten, kunnen we met wat verbeelding wel een verband afleiden.
2008-11-22 12:57:17 [Inge Meelberghs] [reply] 
Bij het interpreteren van de kubus moet je opletten! Hoe je deze ook bekijkt, er zal altijd vertekening zijn. Dit komt doordat de kubus een 3D figuur is dat op een 2D scherm wordt afgebeeld. Het is dus heel moeilijk om  hier inzicht in te krijgen.  
 
De trivariate scatterplots geeft een projectie van bovenstaande kubussen weer. Net als de kubus geeft ook deze grafiek een vertekend beeld omdat de scaterplots 2 dimensionseel zijn en er met de derde variable hier dus geen rekening wordt gehouden.  
 
Je kan dus best de bivariate scatter plot gebruiken. Door gebruik van deze grafiek kan je op een makkelijke manier twee variabelen met elkaar vergelijken. Bij deze techniek wordt gebruik gemaakt van hoogtelijnen die punten van gelijke dichtheid met elkaar verbinden . Op de grafiek kan je zien dat er verschillende zones voorkomen door de kleurverandering. De rode zone duidt op een sterke correlatie, de groene en de gele duiden op een eerdere zwakke correlatie. Het is in dit geval dus inderdaad zo dat er een sterk verband is tussen het Vlaams en het Waals gewest.
2008-11-23 16:04:51 [Nathalie Boden] [reply] 
Bij deze methode worden er 3 variabelen weergegeven. Het is niet eenvoudig om hieruit een besluit te trekken. Hier wordt een 3D-kubus geprojecteerd op een 2D scherm. De punten komen via deze manier achter mekaar te liggen dus kan je ze niet van mekaar onderscheiden. Bijvoorbeeld punten die op de grafiek hier dicht bij mekaar liggen, kunnen in werkelijkheid niet het geval zijn. We moeten met andere woorden de kubus langs alle zijden bekijken. Daarom is het beter om een bivariate scatterplot te gebruiken. Hier wordt er gebruik gemaakt van hoogtelijnen en het geeft meer informatie waardoor we de clusters veel beter kunnen zien.
2008-11-24 16:26:47 [Bernard Femont] [reply] 
Een groot nadeel bij trivariate scatterplots is dat het niet eenvoudig is om een patroon te zien omdat een 3D kubus wordt geprojecteerd op een 2D scherm. => Dit zorgt voor een vertekend beeld. Daarom zullen de eerste drie grafieken niet worden besproken.Als je echter kijkt naar de linker-binnenhoek van de kubus zie je dat de meeste punten daar gecentraliseerd zijn. tot slot hebben we de Bivariate Kernell Density plots. Hier gaat men het scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte. Het is in dit geval dus inderdaad zo dat er een sterk verband is tussen het Vlaams en het Waals gewest.
2008-11-24 19:22:26 [Liese Tormans] [reply] 
Aan de hand van de Trivariate Scatterplots is het niet eenvoudig een mooi patroon te vinden en een conclusie te trekken. Want de 3D voorstelling geeft een vertekend beeld op een 2D scherm. Daarnaast weet je niet hoe 3D zich uit tussen de afstand van de punten. De  
Bivariate Density is een betere methode om te gaan kijken of er een verband is en of er eventuele clusters zijn.  
Want de Bivariate Density gaat met behulp van hoogtelijnen de punten van gelijkaardige observaties verbinden. De grafiek bestaat uit verschillende kleuren die intensiteit weergeven.  
Een rode kleur geeft een sterke intensiteit weer terwijl de gele en groene kleur wijzen op een eerder zwakke correlatie. 
Ook is het mogelijk om aan de hand van deze grafiek de clusters af te lezen. 
 
Het voordeel hier is dat we meer info krijgen dan bij de scatter plot of gewone correlatie. 
Want bij de andere grafieken is niet echt rekening gehouden met de invloed van de derde variabele. 
 
Als we dan naar de Bivariate Density gaan kijken zien we dat er een sterk verband is tussen het Vlaams en Waalse gewest. En dan weer een minder sterk verband hebben tussen het Brusselse gewest. Dit is mogelijk te verklaren doordat het Brussels gewest  kleiner in omvang is als de het Vlaamse en Waalse gewest. 
2008-11-24 19:52:45 [Jeroen Aerts] [reply] 
De Trivariate scatterplots geven in 3D-weergave een vertekend beeld aangezien we werken met een 2D-beeldscherm. De bivariate kernel density geeft wel een goede weergave weer van de punten door te werken met hoogtelijnen. Hier zien we duidelijk dat deze altijd op de rechte liggen, bij de 3 gevallen, 1 geval is zeer duidelijk, waar er sprake is van een hoge density. De rode gebieden hebben een hoge density en vormen clusters.
2008-11-24 23:12:36 [Kristof Augustyns] [reply] 
Het is hier correct. 
Je ziet duidelijk op de grafiek dat er een duidelijk correlatie bestaat tussen Vlaams en Waals Gewest. 
Je kan gewoon een rechte trekken van links vanonder tot rechts vanboven. 
Zonder enige afwijking welteverstaan. 
Bij de rest kan je dat niet dus daar niet zo een hoge correlatie. 
Dit kan wel een vertekend beeld geven want het zou wel raar zijn dat er enkel een groot verband bestaat tussen Vlaams en Waals en bij de rest zie je totaal geen correlatie. 
Dit komt door het 3D-effect. 
De puntjes zijn observaties.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Dataseries Z:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=23570&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=23570&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=23570&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	3 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Brussels Gewest ; par6 = Vlaams Gewest ; par7 = Waals Gewest ;

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Brussels Gewest ; par6 = Vlaams Gewest ; par7 = Waals Gewest ;

R code (references can be found in the software module):

x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code