Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_cloud.wasp
Title produced by softwareTrivariate Scatterplots
Date of computationSun, 09 Nov 2008 10:25:22 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/09/t1226251558xvkwoxn1ellbk5m.htm/, Retrieved Sun, 19 May 2024 09:24:33 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=22786, Retrieved Sun, 19 May 2024 09:24:33 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact153
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Trivariate Scatterplots] [Various EDA Topic...] [2008-11-09 17:25:22] [0831954c833179c36e9320daee0825b5] [Current]
Feedback Forum
2008-11-19 11:59:19 [Bob Leysen] [reply
De link is correct. Het is duidelijk dat het Vlaams Gewest de grootste invloed heeft en dat de correlatie tussen x en z minder invloed kent.
Op de Bivariate Kernel Density Plot (x,y) zien we de punten quasi op 1 lijn liggen. De beide clusters geven ook een hoge densiteit aan.

Enkele opmerkingen:

Een 3D kubus op een 2D scherm geeft vertekeningen. Punten die dicht bij elkaar liggen kunnen in werkelijkheid ver van elkaar liggen. Dit is ook het geval met een 2D scatterplot.
2008-11-21 15:29:11 [Stijn Van de Velde] [reply
Het voordeel is hier dat we 3 reeksen tegelijk met elkaar kunnen vergelijken, en dit niet zoals bij de Bivariate Kernel Density een voor een moeten gaan doen.

Eerst en vooral krijgen we 3D kubussen te zien. Hieruit kunnen we echter weinig conclusies trekken, aangezien deze kubussen op een 2D scherm worden weer gegeven en zo voor een vertekend beeld zorgen. Van uit welke we hoek we ook kijken, het blijft gevaarlijk om op deze manier besluiten te nemen.

Als oplossing daarvoor kijgen we de Bivariate Kernel Density Plot grafieken. Deze grafiek vermijd het probleem door te werken met hoogtelijnen. De hoogste punten, die waar de dichtheid van de data het grootste is, krijgen dan een wit/roze kleur. De groene kleuren duiden op gebieden zonder enige dichtheid.

Je conclusie is dus juist, maar het valt wel op dat ze alle 3 een zeer sterke onderlinge correlatie hebben, wat ook logisch is.

Post a new message
Dataseries X:
15107
15024
12083
15761
16943
15070
13660
14769
14725
15998
15371
14957
15470
15102
11704
16284
16727
14969
14861
14583
15306
17904
16379
15420
17871
15913
13867
17823
17872
17422
16705
15991
16584
19124
17839
17209
18587
16258
15142
19202
17747
19090
18040
17516
17752
21073
17170
19440
19795
17575
16165
19465
19932
19961
17343
18924
18574
21351
18595
19823
20844
19640
17735
19814
22239
20682
17819
21872
22117
21866
Dataseries Y:
12055
12113
9617
12646
13581
12162
10970
11880
11888
12927
12300
12093
12381
12197
9455
13168
13428
11981
11885
11692
12234
14341
13131
12421
14286
12865
11160
14316
14389
14014
13419
12770
13316
15333
14243
13824
14963
13203
12199
15509
14200
15170
14058
13786
14148
16542
13588
15582
15803
14131
12923
15612
16034
16037
14038
15331
15038
17402
14993
16044
16930
15921
14417
15961
17852
16484
14216
17430
17840
17629
Dataseries Z:
2411
2361
1924
2487
2675
2296
2102
2322
2274
2501
2435
2273
2455
2329
1897
2608
2712
2322
2283
2241
2417
2829
2601
2321
2769
2457
2143
2764
2789
2680
2537
2683
2700
3098
3015
2878
3011
2612
2419
3097
3013
3397
3423
3299
3066
3918
3154
3335
3462
3019
2832
3301
3343
3464
3017
3201
3135
3550
3247
3442
3536
3385
2997
3403
3900
3776
3198
4022
3845
3818




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time5 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 5 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=22786&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]5 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=22786&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=22786&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time5 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24



Parameters (Session):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Variable X ; par6 = Variable Y ; par7 = Variable Z ;
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = Y ; par4 = Y ; par5 = Variable X ; par6 = Variable Y ; par7 = Variable Z ;
R code (references can be found in the software module):
x <- array(x,dim=c(length(x),1))
colnames(x) <- par5
y <- array(y,dim=c(length(y),1))
colnames(y) <- par6
z <- array(z,dim=c(length(z),1))
colnames(z) <- par7
d <- data.frame(cbind(z,y,x))
colnames(d) <- list(par7,par6,par5)
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
if (par1>500) par1 <- 500
if (par2>500) par2 <- 500
if (par1<10) par1 <- 10
if (par2<10) par2 <- 10
library(GenKern)
library(lattice)
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='black', ...)
}
bitmap(file='cloud1.png')
cloud(z~x*y, screen = list(x=-45, y=45, z=35),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud2.png')
cloud(z~x*y, screen = list(x=35, y=45, z=25),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='cloud3.png')
cloud(z~x*y, screen = list(x=35, y=-25, z=90),xlab=par5,ylab=par6,zlab=par7)
dev.off()
bitmap(file='pairs.png')
pairs(d,diag.panel=panel.hist)
dev.off()
x <- as.vector(x)
y <- as.vector(y)
z <- as.vector(z)
bitmap(file='bidensity1.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=cor(x,y), xbandwidth=dpik(x), ybandwidth=dpik(y))
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,y)',xlab=par5,ylab=par6)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
bitmap(file='bidensity2.png')
op <- KernSur(y,z, xgridsize=par1, ygridsize=par2, correlation=cor(y,z), xbandwidth=dpik(y), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (y,z)',xlab=par6,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(y,z)
(r<-lm(z ~ y))
abline(r)
box()
dev.off()
bitmap(file='bidensity3.png')
op <- KernSur(x,z, xgridsize=par1, ygridsize=par2, correlation=cor(x,z), xbandwidth=dpik(x), ybandwidth=dpik(z))
op
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main='Bivariate Kernel Density Plot (x,z)',xlab=par5,ylab=par7)
if (par3=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par4=='Y') points(x,z)
(r<-lm(z ~ x))
abline(r)
box()
dev.off()