Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_cloud.wasp
Title produced by softwareTrivariate Scatterplots
Date of computationThu, 13 Nov 2008 15:08:03 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/13/t12266141404r34bbkqfgieskc.htm/, Retrieved Sun, 19 May 2024 11:13:08 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=24864, Retrieved Sun, 19 May 2024 11:13:08 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact158
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Trivariate Scatterplots] [] [2008-11-13 22:08:03] [0655940460a4fd80d3d4d54548b75d49] [Current]
Feedback Forum
2008-11-19 14:48:37 [Sam De Cuyper] [reply
Ook hier maakt de student enkel de berekening zonder conclusies te geven.
Via de trivariate scatterplot kunnen we het verband tussen 3 variabelen gelijktijdig bestuderen. Naargelang de rotatie van de 3D figuren (ontbreken in deze taak) zal je andere dingen zien. Je moet daarom voorzichtig zijn bij de interpretatie van deze figuren. In het algemeen dien je de 2 dimensionale figuur van de matrix te bekijken, waarbij een vertekening tot stand komt door weglating van de 3de dimensie. Als oplossing zou je de bivariate density moeten gebruiken die in deze taak ontbreken.
2008-11-24 18:55:59 [Birgit Van Dyck] [reply
De student heeft hier geen interpreatie gegeven. De student geeft geen enkele van de 3 scatterplots. De drie dimensionele scatterplot geeft het verband weer tussen 3 variabelen. Er worden 3 verschillende perspectieven weergegeven. Er wordt ook een gestandaardiseerde projectie weergegeven, deze laat het verband zien tussen slechts 2 variabelen. Deze laatste geeft wel een vertekent beeld omdat bepaalde dimensies worden gereduceerd.
2008-11-24 19:26:20 [Jasmine Hendrikx] [reply
Evaluatie Q1:
De driedimensionele kubussen zijn niet mee in het document gezet en dit zou er wel bij moeten. Een trivariate scatterplot geeft het verband weer tussen de 3 variabelen tegelijkertijd en dit is wel een voordeel. De kubus wordt ook vanuit verschillende standpunten bekeken. Naargelang waarop de kubus bekeken wordt, krijg je dus een ander beeld. Men moet vooral gebruik maken van het overzicht, dat de student wel in het document heeft gezegd. Er is hiervan wel niet echt een bespreking gegeven. In dit overzicht staan er histogrammen op de diagonaal en scatterplots boven en onder de diagonaal. Het is wel zo dat deze scatterplots vertekend zijn, doordat bepaalde dimensies gereduceerd zijn. Punten die bijvoorbeeld dicht bij elkaar lijken te liggen, kunnen toch ver uit elkaar blijken te liggen. Deze problemen kunnen een beetje opgelost worden met de bivariate kernel density plot. De student heeft echter geen kernel density plot berekend. Dit is wel jammer, aangezien deze een toegevoegde waarde kunnen leveren om verbanden te onderzoeken en te interpreteren. Wanneer we dus naar het overzicht kijken met de scatterplots, zien we dat er over het algemeen niet echt sprake is van een verband tussen de variabelen. De punten bevinden zich duidelijk niet op een rechte en zijn willekeurig verspreid (dit is wel minder het geval bij de scatteplot tussen tomaten en kropsla, hier zou er sprake kunnen zijn van een licht positief verband). Wanneer we op de URL klikken die gegeven is bij het overzicht van de scatterplots kunnen we toch de kernel density plots raadplegen. We zien hier dat onze conclusies bevestigd worden. Nergens valt een sterk verband af te leiden. Uit de kernel density plots van gehakt en kropsla, en gehakt en tomaten kunnen we zien dat hier een heel klein negatief verband te bespeuren is (wat we ook al konden opmerken bij de partiële correlatie). Op deze kernel density plots zijn voornamelijk figuren te vinden die de vorm aannemen van een cirkel. Dit is ook een aanwijzing dat we niet van een verband kunnen bespreken tussen deze variabelen. We kunnen wel afleiden uit de kernel density plot van tomaten en kropsla dat er hier een positief verband waar te nemen valt. De hoogtelijnen uit de kernel density plot zijn vrij ellipsvormig en hebben over het algemeen een positieve helling. Bij de buitenste hoogtelijnen is dit echter wel minder duidelijk. Waar de concentratie van punten het hoogst is, daar vinden we ook de hoogste hoogtelijn. Eventueel zou er ook nog bij vermeld kunnen worden dat de lijn die door de kernel density plot wordt getekend, de lijn is die zo dicht mogelijk de puntenwolk benadert (= regressierechte). Het positieve verband tussen tomaten en kropsla kunnen we ook uit de scatterplot afleiden.De punten zijn hier minder verspreid.

Post a new message
Dataseries X:
3.3
2.86
2.27
1.95
2.98
1.71
1.31
1.37
1.8
2.14
2.05
2.43
5.28
4.07
3.24
1.22
1.18
1
1.18
1.86
2.38
1.48
1.62
2.44
3.91
3.83
2.9
1.67
1.19
1.26
1.6
2.61
2.19
1.46
2.17
2.6
4.33
2.9
2.05
1.51
1.19
1.08
1.1
1.39
1.35
1.69
2.35
3.7
3.55
3.75
4.23
2.13
1.33
1.46
2.1
1.76
1.28
1.26
1.99
3.06
3.33
4.02
2.43
1.39
1.52
1.75
2.22
2.57
2.37
1.69
2.71
3.06
4.64
3.22
2.35
2.01
1.49
1.31
1.29
1.33
1.33
1.39
2.39
3.04
Dataseries Y:
2.36
1.95
2.16
2.76
2.09
1.49
1.17
1.3
1.26
2.17
2.03
2.18
2.61
2.58
3.86
3.81
2.41
1.47
1.33
1.38
1.57
2.6
2.18
2.36
2.24
2.41
2.51
2.98
1.87
1.9
1.47
1.45
2.71
2.9
2.11
2.18
2.24
2.05
2.42
2.77
1.99
1.47
1.09
0.93
1.32
2.03
2.04
2.78
2.8
3.03
3.11
2.75
2.78
1.76
1.29
1.28
1.43
1.71
1.89
1.84
2.08
2.09
2.36
2.99
2.75
1.58
1.69
1.3
1.97
1.84
1.96
1.86
2.75
2.62
2.41
3.61
2.03
1.45
1.4
1.3
1.58
2.1
2.27
2.54
Dataseries Z:
5.41
5.46
5.64
5.76
5.82
5.84
5.83
5.85
5.85
5.88
5.87
5.87
5.85
5.89
5.88
5.89
5.9
5.91
5.89
5.92
5.91
5.96
5.96
5.99
5.92
5.96
5.96
5.97
5.96
5.95
5.97
5.98
5.99
6.03
6.05
6.08
6.1
6.11
6.09
6.1
6.12
6.13
6.13
6.17
6.19
6.23
6.21
6.23
6.25
6.23
6.23
6.24
6.28
6.3
6.34
6.27
6.22
6.31
6.33
6.31
6.35
6.33
6.36
6.37
6.33
6.34
6.42
6.42
6.48
6.47
6.5
6.52
6.49
6.51
6.52
6.54
6.59
6.6
6.59
6.58
6.55
6.57
6.61
6.61




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=24864&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=24864&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=24864&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24



Parameters (Session):
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Kropsla ; par6 = Tomaten ; par7 = Gehakt ;
R code (references can be found in the software module):
x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()