Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_cloud.wasp
Title produced by softwareTrivariate Scatterplots
Date of computationTue, 11 Nov 2008 08:06:59 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/11/t1226416076o0064z0dr9agbws.htm/, Retrieved Sun, 19 May 2024 10:42:51 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=23570, Retrieved Sun, 19 May 2024 10:42:51 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact161
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Trivariate Scatterplots] [Q1 triv scat] [2008-11-11 15:06:59] [e11d930c9e2984715c66c796cf63ef19] [Current]
Feedback Forum
2008-11-16 15:09:44 [Jan Van Riet] [reply
Het grote probleem bij trivariate correlatie is dat er altijd een zekere vertekening optreedt (bij elke invalshoek). 2 punten die op de 3D-grafiek dichtbij liggen, kunnen in werkelijkheid ver uit mekaar liggen.
Ook de tweedimensionale scatterplot geeft dit vertekend beeld.
Enkel de bivariate scatter plot is bruikbaar en nuttig om zaken uit af te leiden. Het bevat hoogtelijnen die punten van gelijke dichtheid met mekaar verbinden. Deze scatterplot geeft ook veel meer info dan de andere plots. Zodoende is dit veruit de beste grafiek om te gaan beslissen of er een verband is of niet.
2008-11-21 15:11:05 [Matthieu Blondeau] [reply
De student geeft hier een correcte interpretatie van de grafieken weer. De Bivariate en de Trivariate geven een duidelijk overzicht tussen het verband van 2 variabelen.
Het voordeel van deze grafieken is dat je verschillende variabelen met mekaar kan vergelijken, je kan de invloed van één of andere variabelen onderzoeken.
Het nadeel is dan dat in de 3D mode je een vertekend beeld krijgt.
2008-11-22 11:24:36 [Wim Golsteyn] [reply
Er is duidelijk een sterk verband tussen het Vlaams en het Waals gewest, en een minder sterk verband tussen deze gewesten en Brussel. Dit komt natuurlijk doordat Brussel proportioneel sterk verschilt in grootte, maar indien we focussen op de grootste clusters in de correlatie tussen Brussel en de andere 2 gewesten, kunnen we met wat verbeelding wel een verband afleiden.
2008-11-22 12:57:17 [Inge Meelberghs] [reply
Bij het interpreteren van de kubus moet je opletten! Hoe je deze ook bekijkt, er zal altijd vertekening zijn. Dit komt doordat de kubus een 3D figuur is dat op een 2D scherm wordt afgebeeld. Het is dus heel moeilijk om hier inzicht in te krijgen.

De trivariate scatterplots geeft een projectie van bovenstaande kubussen weer. Net als de kubus geeft ook deze grafiek een vertekend beeld omdat de scaterplots 2 dimensionseel zijn en er met de derde variable hier dus geen rekening wordt gehouden.

Je kan dus best de bivariate scatter plot gebruiken. Door gebruik van deze grafiek kan je op een makkelijke manier twee variabelen met elkaar vergelijken. Bij deze techniek wordt gebruik gemaakt van hoogtelijnen die punten van gelijke dichtheid met elkaar verbinden . Op de grafiek kan je zien dat er verschillende zones voorkomen door de kleurverandering. De rode zone duidt op een sterke correlatie, de groene en de gele duiden op een eerdere zwakke correlatie. Het is in dit geval dus inderdaad zo dat er een sterk verband is tussen het Vlaams en het Waals gewest.
2008-11-23 16:04:51 [Nathalie Boden] [reply
Bij deze methode worden er 3 variabelen weergegeven. Het is niet eenvoudig om hieruit een besluit te trekken. Hier wordt een 3D-kubus geprojecteerd op een 2D scherm. De punten komen via deze manier achter mekaar te liggen dus kan je ze niet van mekaar onderscheiden. Bijvoorbeeld punten die op de grafiek hier dicht bij mekaar liggen, kunnen in werkelijkheid niet het geval zijn. We moeten met andere woorden de kubus langs alle zijden bekijken. Daarom is het beter om een bivariate scatterplot te gebruiken. Hier wordt er gebruik gemaakt van hoogtelijnen en het geeft meer informatie waardoor we de clusters veel beter kunnen zien.
2008-11-24 16:26:47 [Bernard Femont] [reply
Een groot nadeel bij trivariate scatterplots is dat het niet eenvoudig is om een patroon te zien omdat een 3D kubus wordt geprojecteerd op een 2D scherm. => Dit zorgt voor een vertekend beeld. Daarom zullen de eerste drie grafieken niet worden besproken.Als je echter kijkt naar de linker-binnenhoek van de kubus zie je dat de meeste punten daar gecentraliseerd zijn. tot slot hebben we de Bivariate Kernell Density plots. Hier gaat men het scatterplot hertekenen en gebruik maken van hoogtelijnen. De densiteit is hoog in het wit-roze gedeelte van de grafiek, en laag in het groene gedeelte. Het is in dit geval dus inderdaad zo dat er een sterk verband is tussen het Vlaams en het Waals gewest.
2008-11-24 19:22:26 [Liese Tormans] [reply
Aan de hand van de Trivariate Scatterplots is het niet eenvoudig een mooi patroon te vinden en een conclusie te trekken. Want de 3D voorstelling geeft een vertekend beeld op een 2D scherm. Daarnaast weet je niet hoe 3D zich uit tussen de afstand van de punten. De
Bivariate Density is een betere methode om te gaan kijken of er een verband is en of er eventuele clusters zijn.
Want de Bivariate Density gaat met behulp van hoogtelijnen de punten van gelijkaardige observaties verbinden. De grafiek bestaat uit verschillende kleuren die intensiteit weergeven.
Een rode kleur geeft een sterke intensiteit weer terwijl de gele en groene kleur wijzen op een eerder zwakke correlatie.
Ook is het mogelijk om aan de hand van deze grafiek de clusters af te lezen.

Het voordeel hier is dat we meer info krijgen dan bij de scatter plot of gewone correlatie.
Want bij de andere grafieken is niet echt rekening gehouden met de invloed van de derde variabele.

Als we dan naar de Bivariate Density gaan kijken zien we dat er een sterk verband is tussen het Vlaams en Waalse gewest. En dan weer een minder sterk verband hebben tussen het Brusselse gewest. Dit is mogelijk te verklaren doordat het Brussels gewest kleiner in omvang is als de het Vlaamse en Waalse gewest.
2008-11-24 19:52:45 [Jeroen Aerts] [reply
De Trivariate scatterplots geven in 3D-weergave een vertekend beeld aangezien we werken met een 2D-beeldscherm. De bivariate kernel density geeft wel een goede weergave weer van de punten door te werken met hoogtelijnen. Hier zien we duidelijk dat deze altijd op de rechte liggen, bij de 3 gevallen, 1 geval is zeer duidelijk, waar er sprake is van een hoge density. De rode gebieden hebben een hoge density en vormen clusters.
2008-11-24 23:12:36 [Kristof Augustyns] [reply
Het is hier correct.
Je ziet duidelijk op de grafiek dat er een duidelijk correlatie bestaat tussen Vlaams en Waals Gewest.
Je kan gewoon een rechte trekken van links vanonder tot rechts vanboven.
Zonder enige afwijking welteverstaan.
Bij de rest kan je dat niet dus daar niet zo een hoge correlatie.
Dit kan wel een vertekend beeld geven want het zou wel raar zijn dat er enkel een groot verband bestaat tussen Vlaams en Waals en bij de rest zie je totaal geen correlatie.
Dit komt door het 3D-effect.
De puntjes zijn observaties.

Post a new message
Dataseries X:
680.2
668.9
611.4
640.8
549.8
541.8
628.6
686.5
611.8
588.4
566.9
563.7
569.9
635.4
590.8
634.3
576.1
351.6
507.5
586.2
666.4
693.6
650.6
654.8
733.5
648.1
678.1
816.2
591
563.5
742.5
694.4
728.6
749
538.9
568.5
692.8
580.5
506.9
612.8
442.9
523.3
596.7
533.7
523.1
559.2
430.7
538.2
612.4
428
522.4
531.1
425.9
410.3
551
555.6
460.2
288.9
392.3
400.5
399
354.9
337.6
379.2
334.1
321.6
449.8
486.3
421.9
405.6
420
432.4
418.1
Dataseries Y:
12710.3
12120.8
12469.5
12054.6
12112.9
9617.2
12645.8
13581.3
12162.3
10969.7
11880
11887.6
12926.9
12300
12092.8
12380.8
12196.9
9455
13168
13427.9
11980.5
11884.8
11691.7
12233.8
14341.4
13130.7
12421.1
14285.8
12864.6
11160.2
14316.2
14388.7
14013.9
13419
12769.6
13315.5
15332.9
14243
13824.4
14962.9
13202.9
12199
15508.9
14199.8
15169.6
14058
13786.2
14147.9
16541.7
13587.5
15582.4
15802.8
14130.5
12923.2
15612.2
16033.7
16036.6
14037.8
15330.6
15038.3
17401.8
14992.5
16043.7
16929.6
15921.3
14417.2
15961
17851.9
16483.9
14215.5
17429.7
17839.5
17629.2
Dataseries Z:
2468.9
2469.2
2417.7
2411.1
2361
1924.1
2486.9
2674.9
2296.2
2101.5
2322
2273.8
2501.3
2435.2
2273.3
2454.7
2328.8
1897
2608.1
2712.3
2322
2282.6
2241.1
2417.2
2829
2600.6
2321
2768.5
2457.3
2142.7
2764.4
2788.9
2679.5
2536.5
2682.7
2699.6
3097.8
3015.2
2878
3010.9
2612.3
2419.3
3096.5
3013
3397.4
3423.1
3298.7
3065.7
3918.3
3154.4
3334.7
3461.6
3018.5
2832
3301.3
3342.8
3464.4
3016.6
3201.3
3135.3
3549.8
3247.2
3441.8
3535.6
3384.7
2996.6
3402.8
3900.2
3776.4
3197.5
4022.4
3845.1
3818.6




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 3 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=23570&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]3 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=23570&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=23570&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time3 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135



Parameters (Session):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Brussels Gewest ; par6 = Vlaams Gewest ; par7 = Waals Gewest ;
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Brussels Gewest ; par6 = Vlaams Gewest ; par7 = Waals Gewest ;
R code (references can be found in the software module):
x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()