Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_cloud.wasp

Title produced by software

Trivariate Scatterplots

Date of computation

Thu, 13 Nov 2008 00:52:39 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/13/t1226563367o2xj5syzsunop7g.htm/, Retrieved Sun, 19 May 2024 09:38:18 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24469, Retrieved Sun, 19 May 2024 09:38:18 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

211

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Trivariate Scatterplots] [various EDA topic...] [2008-11-13 07:52:39] [821c4b3d195be8e737cf8c9dc649d3cf] [Current]

Feedback Forum

2008-11-16 15:01:02 [Gert-Jan Geudens] [reply] 
De berekeningen van de student zijn goed, al had de uitleg wel beter kunnen zijn. De student heeft de trivariate scatterplots weergegeven wat redelijk overbodig is aangezien deze een vertekend beeld geven door de 2-dimensionele voorstelling. Ook betreffende bivariate kernel density plots, is het antwoord van de student niet helemaal compleet.  
De student heeft 1 grafiek weergegeven en geen echte conclusies getrokken. De conclusies die de student had kunnen weergeven zijn de volgende : 
 
*bij de plot met verband tussen wisselkoers en uitvoer : 
We zien hier een zeer klein tot zelfs geen verband. 
 
*bij de plot met verband tussen wisselkoers en invoer : 
We zien hier een groot positief verband bij een wisselkoers van ongeveer 110 en 135. Dit positief verband kunnen we afleiden doordat de hoogtelijnen een positief gerichte ovaal vormen. Als deze een cirkel zouden vormen, is er geen of een zeer klein verband. 
 
*bij de plot met verband tussen wisselkoers en uitvoer : 
We zien hier een zeer groot positief verband bij een uitvoer van ongeveer 130. 
 
De vragen die we hierbij kunnen oproepen hadden we niet kunnen oproepen bij de trivariate scatterplots en de gestandardiseerde projecties.
2008-11-17 14:12:22 [Stefan Temmerman] [reply] 
Trivariate scatterplot: Deze plot laat in 3 dimensies het verband zien van 3 variabelen tegelijkertijd. De gegevens liggen in deze plot verspreid, zoals de student zegt. Dit wijst op een zwakke correlatie tussen de drie variabelen. 
	 
Bivariate Density plot: De student vermeldt hier correct dat we deze plot gebruiken voor de correlatie van twee variabelen visueel waar te nemen, en dat de rechte (regressielijn) de beste visualisatie is van al de punten. Bij de invoer & wisselkoers zijn de clusters meer ellipsvormig dan cirkelvormig, wat wijst op een verband. 
2008-11-19 15:56:11 [Carole Thielens] [reply] 
Wat op de scatterplot grafisch weergegeven wordt, is reeds cijfermatig voorgesteld bij de tabel van partial correlation. De scatterplots vormen hierop een goede aanvulling, gezien het verband tussen de drie variabelen nu op alle mogelijke manieren geanalyseerd is. 
In een trivariate scatterplot wordt immers nogmaals het verband nagegaan tussen 3 variabelen x,y en z. De kubussen die gevormd zijn, kunnen vanuit 3 verschillende perspectieven bekeken worden. Naargelang de invalshoek die je gebruikt, merk je daarbij andere problemen op. De kubus kan eventueel ook ‘platgedrukt’ worden tot een tweedimensionale grafische voorstelling. Deze tweedimensionale grafische voorstelling, welke in de link terug te vinden is, werd door de student echter niet bestudeerd of uitgelegd. Wel vond ik verder in zijn document terug, dat hij een kendall tau correlation plot opnam in een aparte link.  
Verder gebruikte de student slechts 1 triviate scatterplot om zijn analyse te staven en besloot hier vervolgens uit dat er een klein verband bestaat tussen de 3 variabelen invoer, uitvoer en wisselkoers. De punten zijn immers verspreid en liggen niet mooi op één rechte. Toch mag hier naar mijn mening wel aan toegevoegd worden dat op alle triviate boxplots duidelijk te zien is dat er een beduidend positief verband bestaat, hoewel we hier zeker niet kunnen spreken van een perfect positief verband.
2008-11-22 13:42:19 [Angelique Van de Vijver] [reply] 
Goede berekening van de trivariate scatterplots en de bivariate kernel density. De gegevens liggen bij de meeste grafieken inderdaad verspreid en niet volgens een lijn (zie kubussen en trivariate scatterplots)zoals de student zegt wat op een zwakke correlatie wijst. Bij de trivariate scatterplot van invoer en wisselkoers kan men wel min of meer een rechte door de punten tekenen wat dus wijst op enige correlatie. 
Extra uitleg: De trivariate scatterplot wordt dus weergeven in verschillende kubussen. Het voordeel is hier dat je de correlatie tussen de 3 variabelen tegelijk kan zien. Er zijn 3 kubussen weergegeven waarbij telkens vanuit een ander perspectief wordt gekeken. De trivariate scatterplots zijn projecties van die kubus. De trivariate scatterplots kunnen dus een vertekend beeld geven doordat er telkens 1 dimensie wordt weggelaten. (kubus=driedimensionaal)(trivariate scatterplot=tweedimensionaal) Daarom worden de kubussen vanuit verschillende perspectieven bekeken zodat je met alle dimensies rekening kunt houden en je alle fenomenen kunt vaststellen. 
 
Goede vaststelling van student dat correlatie tussen invoer en wisselkoers het grootste is wat we ook al hadden vastgesteld in de correlatietabel. Op de bivariate kernel density van invoer en wisselkoers zien we dat de clusters meer ellipsvormig zijn en meer naar rechtsboven gericht zijn dan de andere bivariate kernel density-grafieken. Dit toont dus de hogere correlatie tussen invoer en wisselkoers. We zien hier ook een hoge dichtheid bij een wisselkoers rond de 135. 
Bij de bivariate kernel density grafiek van invoer en uitvoer zijn de clusters meer cirkelvormig wat dus wijst op een lage correlatie. 
De bivariate kernel density is soms een beter manier om verbanden uit af te leiden die je soms niet kan afleiden uit een gewone scatterplot.
2008-11-24 23:35:12 [Jessica Alves Pires] [reply] 
Ik ben het eens met Gert-Jan en Angelique. Ik heb er niets aan toe voegen, ik zou alleen maar in herhaling vallen.

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Dataseries Y:

Download CSV

Histogram

Dataseries Z:

Download CSV

Histogram

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	6 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 6 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24469&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]6 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24469&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24469&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	6 seconds
R Server	'Herman Ole Andreas Wold' @ 193.190.124.10:1001

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Wisselkoers : 1euro=...yen ; par6 = Uitvoer naar Japan ; par7 = Invoer vanuit Japan ;

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Wisselkoers : 1euro=...yen ; par6 = Uitvoer naar Japan ; par7 = Invoer vanuit Japan ;

R code (references can be found in the software module):

x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code