Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_bidensity.wasp
Title produced by softwareBivariate Kernel Density Estimation
Date of computationTue, 11 Nov 2008 04:26:03 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/11/t1226402831jfojx6mu9ugj3x4.htm/, Retrieved Sun, 19 May 2024 08:51:25 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=23328, Retrieved Sun, 19 May 2024 08:51:25 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact130
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F       [Bivariate Kernel Density Estimation] [8.3 various EDA T...] [2008-11-11 11:26:03] [0cebda6bbc99948f606f5db2560512ab] [Current]
Feedback Forum
2008-11-15 12:07:05 [58d427c57bd46519a715a3a7fea6a80f] [reply
Op de bivariate Kernel zie je naast de puntenwolk een lijn die zo dicht mogelijk de puntenwolk benadert (=regressielijn), de hogelijnen zijn de omtrek van de schijfjes. In dit geval zijn de omtreklijnen niet cirkelvormig dus de correlatie is niet gelijk aan 0. Als je de tabel er zou bijzetten zou je kunnen zeggen hoeveel de correlatie is.
  2008-11-24 13:50:37 [58d427c57bd46519a715a3a7fea6a80f] [reply
Ter aanvulling:
* A.h.v. de puntenwolk van de scatterplot gaat men de bivariate density tekenen. Als er in de puntenwolk ergens heel veel punten zich samen bevinden, is er daar een hoge concentratie van punten. Je gaat daar dan ook de hoogste hoogtelijn vinden.
* Hoogtelijnen hebben te maken met de concentratie van punten: de waarschijnlijkheid dat de punten zich daar bevinden.
De rechte lijn in de bivariate density is het gemiddelde van alle gegevens.
2008-11-15 14:06:31 [Philip Van Herck] [reply
  2008-11-15 14:15:06 [Philip Van Herck] [reply
Bij de Bivariate Kernel Density analyse vinden we een regressielijn terug. Deze lijn benadert de puntenwolken zo dicht mogelijk. In dien alle waarnemingen op deze regressierechte zouden liggen, zouden we kunnen spreken van een perfect lineaire correlatie. We zien ook de hoogtelijnen op de figuur die enige verduidelijking geven omtrent de de dichtheid van de waarnemingen ten op zichte van elkaar. Zo kunnen we zien dat waar de oppervlaktes binnen de hoogtelijnen roze gekleurd zijn, er een zeer hoge concentratie van waarnemingen voorkomt. Indien we, maar dit is hier nu niet het geval, verschillende clusters van hoge concentratie zouden hebben, kunnen we besluiten dat er pieken van concentratie zijn met betrekking tot de tijd. Dit is vooral zo wanneer de hoogtelijnen echt cirkels vormen, en niet wanneer zij ellipsen zijn.
2008-11-18 11:19:31 [407693b66d7f2e0b350979005057872d] [reply
Q1

De student heeft hier zijn data bestanden niet bijgevoegd. Dit antwoord is gedeeltelijk goed beantwoord. Bij de density plot als de kleuren lichter worden wordt de dichtheid tussen de punten groter deze grafiek wordt gebruikt om de scatterplot op een andere manier te bekijken. De bivariate density geeft ook hoogtelijnen en regressielijnen weer als de knooppunten op een lijn liggen kunnen we zijn of het een lineair verband is of niet tussen de punten. Met de trivariate scatterplot kunnen we de correlatie van 3 variabelen tegelijkertijd bekijken. Er worden verschillende perspectieven getoond wen maken gebruik van gestandaardiseerde projecties met histogrammen en scatterplots


Post a new message
Dataseries X:
31/08/2001
30/09/2001
31/10/2001
30/11/2001
31/12/2001
31/01/2002
28/02/2002
31/03/2002
30/04/2002
31/05/2002
30/06/2002
31/07/2002
31/08/2002
30/09/2002
31/10/2002
30/11/2002
31/12/2002
31/01/2003
28/02/2003
31/03/2003
30/04/2003
31/05/2003
30/06/2003
31/07/2003
31/08/2003
30/09/2003
31/10/2003
30/11/2003
31/12/2003
31/01/2004
29/02/2004
31/03/2004
30/04/2004
31/05/2004
30/06/2004
31/07/2004
31/08/2004
30/09/2004
31/10/2004
30/11/2004
31/12/2004
31/01/2005
28/02/2005
31/03/2005
30/04/2005
31/05/2005
30/06/2005
31/07/2005
31/08/2005
30/09/2005
31/10/2005
30/11/2005
31/12/2005
31/01/2006
28/02/2006
31/03/2006
30/04/2006
31/05/2006
30/06/2006
31/07/2006
31/08/2006
30/09/2006
31/10/2006
30/11/2006
31/12/2006
31/01/2007
28/02/2007
31/03/2007
30/04/2007
31/05/2007
30/06/2007
31/07/2007
31/08/2007
30/09/2007
31/10/2007
30/11/2007
31/12/2007
31/01/2008
29/02/2008
31/03/2008
30/04/2008
31/05/2008
30/06/2008
31/07/2008
31/08/2008
Dataseries Y:
97,8
107,4
117,5
105,6
97,4
99,5
98
104,3
100,6
101,1
103,9
96,9
95,5
108,4
117
103,8
100,8
110,6
104
112,6
107,3
98,9
109,8
104,9
102,2
123,9
124,9
112,7
121,9
100,6
104,3
120,4
107,5
102,9
125,6
107,5
108,8
128,4
121,1
119,5
128,7
108,7
105,5
119,8
111,3
110,6
120,1
97,5
107,7
127,3
117,2
119,8
116,2
111
112,4
130,6
109,1
118,8
123,9
101,6
112,8
128
129,6
125,8
119,5
115,7
113,6
129,7
112
116,8
127
112,1
114,2
121,1
131,6
125
120,4
117,7
117,5
120,6
127,5
112,3
124,5
115,2
105,4




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=23328&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=23328&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=23328&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'George Udny Yule' @ 72.249.76.132







Bandwidth
x axis0.000360840275187140
y axis4.64890339140664
Correlation
correlation used in KDE-0.177693041385040
correlation(x,y)-0.177693041385040

\begin{tabular}{lllllllll}
\hline
Bandwidth \tabularnewline
x axis & 0.000360840275187140 \tabularnewline
y axis & 4.64890339140664 \tabularnewline
Correlation \tabularnewline
correlation used in KDE & -0.177693041385040 \tabularnewline
correlation(x,y) & -0.177693041385040 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=23328&T=1

[TABLE]
[ROW][C]Bandwidth[/C][/ROW]
[ROW][C]x axis[/C][C]0.000360840275187140[/C][/ROW]
[ROW][C]y axis[/C][C]4.64890339140664[/C][/ROW]
[ROW][C]Correlation[/C][/ROW]
[ROW][C]correlation used in KDE[/C][C]-0.177693041385040[/C][/ROW]
[ROW][C]correlation(x,y)[/C][C]-0.177693041385040[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=23328&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=23328&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Bandwidth
x axis0.000360840275187140
y axis4.64890339140664
Correlation
correlation used in KDE-0.177693041385040
correlation(x,y)-0.177693041385040



Parameters (Session):
par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ;
Parameters (R input):
par1 = 50 ; par2 = 50 ; par3 = 0 ; par4 = 0 ; par5 = 0 ; par6 = Y ; par7 = Y ;
R code (references can be found in the software module):
par1 <- as(par1,'numeric')
par2 <- as(par2,'numeric')
par3 <- as(par3,'numeric')
par4 <- as(par4,'numeric')
par5 <- as(par5,'numeric')
library('GenKern')
if (par3==0) par3 <- dpik(x)
if (par4==0) par4 <- dpik(y)
if (par5==0) par5 <- cor(x,y)
if (par1 > 500) par1 <- 500
if (par2 > 500) par2 <- 500
bitmap(file='bidensity.png')
op <- KernSur(x,y, xgridsize=par1, ygridsize=par2, correlation=par5, xbandwidth=par3, ybandwidth=par4)
image(op$xords, op$yords, op$zden, col=terrain.colors(100), axes=TRUE,main=main,xlab=xlab,ylab=ylab)
if (par6=='Y') contour(op$xords, op$yords, op$zden, add=TRUE)
if (par7=='Y') points(x,y)
(r<-lm(y ~ x))
abline(r)
box()
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Bandwidth',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'x axis',header=TRUE)
a<-table.element(a,par3)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'y axis',header=TRUE)
a<-table.element(a,par4)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Correlation',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation used in KDE',header=TRUE)
a<-table.element(a,par5)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'correlation(x,y)',header=TRUE)
a<-table.element(a,cor(x,y))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')