Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_cloud.wasp
Title produced by softwareTrivariate Scatterplots
Date of computationThu, 13 Nov 2008 00:52:39 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/13/t1226563367o2xj5syzsunop7g.htm/, Retrieved Sun, 19 May 2024 09:38:18 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24469, Retrieved Sun, 19 May 2024 09:38:18 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact211
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Trivariate Scatterplots] [various EDA topic...] [2008-11-13 07:52:39] [821c4b3d195be8e737cf8c9dc649d3cf] [Current]
Feedback Forum
2008-11-16 15:01:02 [Gert-Jan Geudens] [reply
De berekeningen van de student zijn goed, al had de uitleg wel beter kunnen zijn. De student heeft de trivariate scatterplots weergegeven wat redelijk overbodig is aangezien deze een vertekend beeld geven door de 2-dimensionele voorstelling. Ook betreffende bivariate kernel density plots, is het antwoord van de student niet helemaal compleet.
De student heeft 1 grafiek weergegeven en geen echte conclusies getrokken. De conclusies die de student had kunnen weergeven zijn de volgende :

*bij de plot met verband tussen wisselkoers en uitvoer :
We zien hier een zeer klein tot zelfs geen verband.

*bij de plot met verband tussen wisselkoers en invoer :
We zien hier een groot positief verband bij een wisselkoers van ongeveer 110 en 135. Dit positief verband kunnen we afleiden doordat de hoogtelijnen een positief gerichte ovaal vormen. Als deze een cirkel zouden vormen, is er geen of een zeer klein verband.

*bij de plot met verband tussen wisselkoers en uitvoer :
We zien hier een zeer groot positief verband bij een uitvoer van ongeveer 130.

De vragen die we hierbij kunnen oproepen hadden we niet kunnen oproepen bij de trivariate scatterplots en de gestandardiseerde projecties.
2008-11-17 14:12:22 [Stefan Temmerman] [reply
Trivariate scatterplot: Deze plot laat in 3 dimensies het verband zien van 3 variabelen tegelijkertijd. De gegevens liggen in deze plot verspreid, zoals de student zegt. Dit wijst op een zwakke correlatie tussen de drie variabelen.

Bivariate Density plot: De student vermeldt hier correct dat we deze plot gebruiken voor de correlatie van twee variabelen visueel waar te nemen, en dat de rechte (regressielijn) de beste visualisatie is van al de punten. Bij de invoer & wisselkoers zijn de clusters meer ellipsvormig dan cirkelvormig, wat wijst op een verband.
2008-11-19 15:56:11 [Carole Thielens] [reply
Wat op de scatterplot grafisch weergegeven wordt, is reeds cijfermatig voorgesteld bij de tabel van partial correlation. De scatterplots vormen hierop een goede aanvulling, gezien het verband tussen de drie variabelen nu op alle mogelijke manieren geanalyseerd is.
In een trivariate scatterplot wordt immers nogmaals het verband nagegaan tussen 3 variabelen x,y en z. De kubussen die gevormd zijn, kunnen vanuit 3 verschillende perspectieven bekeken worden. Naargelang de invalshoek die je gebruikt, merk je daarbij andere problemen op. De kubus kan eventueel ook ‘platgedrukt’ worden tot een tweedimensionale grafische voorstelling. Deze tweedimensionale grafische voorstelling, welke in de link terug te vinden is, werd door de student echter niet bestudeerd of uitgelegd. Wel vond ik verder in zijn document terug, dat hij een kendall tau correlation plot opnam in een aparte link.
Verder gebruikte de student slechts 1 triviate scatterplot om zijn analyse te staven en besloot hier vervolgens uit dat er een klein verband bestaat tussen de 3 variabelen invoer, uitvoer en wisselkoers. De punten zijn immers verspreid en liggen niet mooi op één rechte. Toch mag hier naar mijn mening wel aan toegevoegd worden dat op alle triviate boxplots duidelijk te zien is dat er een beduidend positief verband bestaat, hoewel we hier zeker niet kunnen spreken van een perfect positief verband.
2008-11-22 13:42:19 [Angelique Van de Vijver] [reply
Goede berekening van de trivariate scatterplots en de bivariate kernel density. De gegevens liggen bij de meeste grafieken inderdaad verspreid en niet volgens een lijn (zie kubussen en trivariate scatterplots)zoals de student zegt wat op een zwakke correlatie wijst. Bij de trivariate scatterplot van invoer en wisselkoers kan men wel min of meer een rechte door de punten tekenen wat dus wijst op enige correlatie.
Extra uitleg: De trivariate scatterplot wordt dus weergeven in verschillende kubussen. Het voordeel is hier dat je de correlatie tussen de 3 variabelen tegelijk kan zien. Er zijn 3 kubussen weergegeven waarbij telkens vanuit een ander perspectief wordt gekeken. De trivariate scatterplots zijn projecties van die kubus. De trivariate scatterplots kunnen dus een vertekend beeld geven doordat er telkens 1 dimensie wordt weggelaten. (kubus=driedimensionaal)(trivariate scatterplot=tweedimensionaal) Daarom worden de kubussen vanuit verschillende perspectieven bekeken zodat je met alle dimensies rekening kunt houden en je alle fenomenen kunt vaststellen.

Goede vaststelling van student dat correlatie tussen invoer en wisselkoers het grootste is wat we ook al hadden vastgesteld in de correlatietabel. Op de bivariate kernel density van invoer en wisselkoers zien we dat de clusters meer ellipsvormig zijn en meer naar rechtsboven gericht zijn dan de andere bivariate kernel density-grafieken. Dit toont dus de hogere correlatie tussen invoer en wisselkoers. We zien hier ook een hoge dichtheid bij een wisselkoers rond de 135.
Bij de bivariate kernel density grafiek van invoer en uitvoer zijn de clusters meer cirkelvormig wat dus wijst op een lage correlatie.
De bivariate kernel density is soms een beter manier om verbanden uit af te leiden die je soms niet kan afleiden uit een gewone scatterplot.
2008-11-24 23:35:12 [Jessica Alves Pires] [reply
Ik ben het eens met Gert-Jan en Angelique. Ik heb er niets aan toe voegen, ik zou alleen maar in herhaling vallen.

Post a new message
Dataseries X:
109.57
107.08
110.33
110.36
106.5
104.3
107.21
109.34
108.2
109.86
108.68
113.38
117.12
116.23
114.75
115.81
115.86
117.8
117.11
116.31
118.38
121.57
121.65
124.2
126.12
128.6
128.16
130.12
135.83
138.05
134.99
132.38
128.94
128.12
127.84
132.43
134.13
134.78
133.13
129.08
134.48
132.86
134.08
134.54
134.51
135.97
136.09
139.14
135.63
136.55
138.83
138.84
135.37
132.22
134.75
135.98
136.06
138.05
139.59
140.58
Dataseries Y:
156,4
143,1
148,9
134
118
125,3
138
114
109,9
151,5
129,1
121,7
126,1
114,3
124,7
111,9
120
119,5
137,8
105,4
135,4
182,5
129,6
147,5
128,9
119,7
149,4
136,6
118,6
121,4
138,9
109,5
131,7
160,3
138,1
136,7
126,6
138
152
137
134,9
154,4
145,2
133,1
169,6
159,3
124,9
138,1
162,5
136,6
148,1
142
137,9
152,5
182,8
135,3
141,8
151,7
140,6
128
Dataseries Z:
377,2
332,2
364,8
352,4
341,6
298,2
355,3
330,9
314,5
418,9
433,2
367
422,9
352,1
419,8
432,7
414,2
387,7
297,2
357,4
384,2
425,2
385,3
355,4
409,8
421,2
421,8
464,2
494
404,2
411,4
403,4
403,3
520,9
439,8
434,8
476,5
454,3
522
498,4
439,9
450,7
447,1
451,3
466,8
498
533,6
451,9
477,1
410,4
469,5
485,4
406,7
439,7
412,2
440,2
411,1
477,7
463,2
320,5




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time6 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 6 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24469&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]6 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24469&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24469&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time6 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001



Parameters (Session):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Wisselkoers : 1euro=...yen ; par6 = Uitvoer naar Japan ; par7 = Invoer vanuit Japan ;
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Wisselkoers : 1euro=...yen ; par6 = Uitvoer naar Japan ; par7 = Invoer vanuit Japan ;
R code (references can be found in the software module):
x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()