Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*Unverified author*

R Software Module

rwasp_cloud.wasp

Title produced by software

Trivariate Scatterplots

Date of computation

Thu, 13 Nov 2008 15:08:03 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/13/t12266141404r34bbkqfgieskc.htm/, Retrieved Sun, 19 May 2024 11:13:08 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24864, Retrieved Sun, 19 May 2024 11:13:08 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

158

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F       [Trivariate Scatterplots] [] [2008-11-13 22:08:03] [0655940460a4fd80d3d4d54548b75d49] [Current]

Feedback Forum

2008-11-19 14:48:37 [Sam De Cuyper] [reply] 
Ook hier maakt de student enkel de berekening zonder conclusies te geven.  
Via de trivariate scatterplot kunnen we het verband tussen 3 variabelen gelijktijdig bestuderen. Naargelang de rotatie van de 3D figuren (ontbreken in deze taak) zal je andere dingen zien. Je moet daarom voorzichtig zijn bij de interpretatie van deze figuren. In het algemeen dien je de 2 dimensionale figuur van de matrix te bekijken, waarbij een vertekening tot stand komt door weglating van de 3de dimensie. Als oplossing zou je de bivariate density moeten gebruiken die in deze taak ontbreken. 
2008-11-24 18:55:59 [Birgit Van Dyck] [reply] 
De student heeft hier geen interpreatie gegeven. De student geeft geen enkele van de 3 scatterplots. De drie dimensionele scatterplot geeft het verband weer tussen 3 variabelen. Er worden 3 verschillende perspectieven weergegeven. Er wordt ook een gestandaardiseerde projectie weergegeven, deze laat het verband zien tussen slechts 2 variabelen. Deze laatste geeft wel een vertekent beeld omdat bepaalde dimensies worden gereduceerd.
2008-11-24 19:26:20 [Jasmine Hendrikx] [reply] 
Evaluatie Q1: 
De driedimensionele kubussen zijn niet mee in het document gezet en dit zou er  wel bij moeten. Een trivariate scatterplot geeft het verband weer tussen de 3 variabelen tegelijkertijd en dit is wel een voordeel. De kubus wordt ook vanuit verschillende standpunten bekeken. Naargelang waarop de kubus bekeken wordt, krijg je dus een ander beeld. Men moet vooral gebruik maken van het overzicht, dat de student wel in het document heeft gezegd. Er is hiervan wel niet echt een bespreking gegeven. In dit overzicht staan er histogrammen op de diagonaal en scatterplots boven en onder de diagonaal. Het is wel zo dat deze scatterplots vertekend zijn, doordat bepaalde dimensies gereduceerd zijn. Punten die bijvoorbeeld dicht bij elkaar lijken te liggen, kunnen toch ver uit elkaar blijken te liggen. Deze problemen kunnen een beetje opgelost worden met de bivariate kernel density plot. De student heeft echter geen kernel density plot berekend. Dit is wel jammer, aangezien deze een toegevoegde waarde kunnen leveren om verbanden te onderzoeken en te interpreteren.  Wanneer we dus naar het overzicht kijken met de scatterplots, zien we dat er over het algemeen niet echt sprake is van een verband tussen de variabelen. De punten bevinden zich duidelijk niet op een rechte en zijn willekeurig verspreid (dit is wel minder het geval bij de scatteplot tussen tomaten en kropsla, hier zou er sprake kunnen zijn van een licht positief verband).  Wanneer we op de URL klikken die gegeven is bij het overzicht van de scatterplots kunnen we toch de kernel density plots raadplegen. We zien hier dat onze conclusies bevestigd worden.  Nergens valt een sterk verband af te leiden.  Uit de kernel density plots van gehakt en kropsla, en gehakt en tomaten kunnen we zien dat hier een heel klein negatief verband te bespeuren is (wat we ook al konden opmerken bij de partiële correlatie). Op deze kernel density plots zijn voornamelijk figuren te vinden die de vorm aannemen van een cirkel. Dit is ook een aanwijzing dat we niet van een verband kunnen bespreken tussen deze variabelen. We kunnen wel afleiden uit de kernel density plot van tomaten en kropsla dat er hier een positief verband waar te nemen valt. De hoogtelijnen uit de kernel density plot zijn vrij ellipsvormig en hebben over het algemeen een positieve helling. Bij de buitenste hoogtelijnen is dit echter wel minder duidelijk. Waar de concentratie van punten het hoogst is, daar vinden we ook de hoogste hoogtelijn.  Eventueel zou er ook nog bij vermeld kunnen worden dat de lijn die door de kernel density plot wordt getekend,  de lijn is die zo dicht mogelijk de puntenwolk benadert (= regressierechte). Het positieve verband tussen tomaten en kropsla kunnen we ook uit de scatterplot afleiden.De punten zijn hier minder verspreid. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

3.3
2.86
2.27
1.95
2.98
1.71
1.31
1.37
1.8
2.14
2.05
2.43
5.28
4.07
3.24
1.22
1.18
1
1.18
1.86
2.38
1.48
1.62
2.44
3.91
3.83
2.9
1.67
1.19
1.26
1.6
2.61
2.19
1.46
2.17
2.6
4.33
2.9
2.05
1.51
1.19
1.08
1.1
1.39
1.35
1.69
2.35
3.7
3.55
3.75
4.23
2.13
1.33
1.46
2.1
1.76
1.28
1.26
1.99
3.06
3.33
4.02
2.43
1.39
1.52
1.75
2.22
2.57
2.37
1.69
2.71
3.06
4.64
3.22
2.35
2.01
1.49
1.31
1.29
1.33
1.33
1.39
2.39
3.04

Dataseries Y:

Download CSV

Histogram

2.36
1.95
2.16
2.76
2.09
1.49
1.17
1.3
1.26
2.17
2.03
2.18
2.61
2.58
3.86
3.81
2.41
1.47
1.33
1.38
1.57
2.6
2.18
2.36
2.24
2.41
2.51
2.98
1.87
1.9
1.47
1.45
2.71
2.9
2.11
2.18
2.24
2.05
2.42
2.77
1.99
1.47
1.09
0.93
1.32
2.03
2.04
2.78
2.8
3.03
3.11
2.75
2.78
1.76
1.29
1.28
1.43
1.71
1.89
1.84
2.08
2.09
2.36
2.99
2.75
1.58
1.69
1.3
1.97
1.84
1.96
1.86
2.75
2.62
2.41
3.61
2.03
1.45
1.4
1.3
1.58
2.1
2.27
2.54

Dataseries Z:

Download CSV

Histogram

5.41
5.46
5.64
5.76
5.82
5.84
5.83
5.85
5.85
5.88
5.87
5.87
5.85
5.89
5.88
5.89
5.9
5.91
5.89
5.92
5.91
5.96
5.96
5.99
5.92
5.96
5.96
5.97
5.96
5.95
5.97
5.98
5.99
6.03
6.05
6.08
6.1
6.11
6.09
6.1
6.12
6.13
6.13
6.17
6.19
6.23
6.21
6.23
6.25
6.23
6.23
6.24
6.28
6.3
6.34
6.27
6.22
6.31
6.33
6.31
6.35
6.33
6.36
6.37
6.33
6.34
6.42
6.42
6.48
6.47
6.5
6.52
6.49
6.51
6.52
6.54
6.59
6.6
6.59
6.58
6.55
6.57
6.61
6.61

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24864&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24864&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24864&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	4 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

Figure 1

PNG link

Postscript link

PDF link

Figure 2

PNG link

Postscript link

PDF link

Figure 3

PNG link

Postscript link

PDF link

Figure 4

PNG link

Postscript link

PDF link

Figure 5

PNG link

Postscript link

PDF link

Figure 6

PNG link

Postscript link

PDF link

Figure 7

PNG link

Postscript link

PDF link

Parameters (Session):

Parameters (R input):

par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Kropsla ; par6 = Tomaten ; par7 = Gehakt ;

R code (references can be found in the software module):

x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code