Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*The author of this computation has been verified*

R Software Module

rwasp_pairs.wasp

Title produced by software

Kendall tau Correlation Matrix

Date of computation

Mon, 03 Nov 2008 13:08:34 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/03/t12257429822xas95ez3lwbwib.htm/, Retrieved Sun, 19 May 2024 12:15:56 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=21159, Retrieved Sun, 19 May 2024 12:15:56 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

237

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Kendall tau Correlation Matrix] [Q1 Deel 2] [2008-11-02 14:26:58] [4300be8b33fd3dcdacd2aa9800ceba23]
F         [Kendall tau Correlation Matrix] [statistiek 4 deel...] [2008-11-03 20:08:34] [2ba2a74112fb2c960057a572bf2825d3] [Current]

Feedback Forum

2008-11-09 15:01:47 [Bob Leysen] [reply] 
Goede grafiek. 
 
De getallen in de rechthoeken zeggen niet wat correlatie is, dit is de betrouwbaarheid van uw correlatie. Hoe hoger het getal, hoe meer louter toeval. 
De tweede kolom (RNR) is het meest betrouwbaar (0,01). 
2008-11-10 08:49:34 [Davy De Nef] [reply] 
De studente maakt gebruik van de juiste software, namelijk de Kendall Tau Correlation plot. Dat is een goede maatstaf voor correlatie. 
Om van excel naar deze methode te komen, heeft de student eerst de rijen en kolommen van plaats verwisseld. Dit is nodig omdat de variabelen bovenaan staan (als kolom). 
De interpretatie van de grafiek gebeurd op een foutieve manier.  
Boven de diagonaal die je kan trekken doorheen de grafieken, zie je kleine grafiekjes die de correlatie weergeven. Een goede correlatie lezen we af als er een stijgende rechte te zien is (zonder al teveel pieken). 
Onder die diagonaal zie je de betrouwbaarheid. Het is dan ook de bedoeling om te gaan kijken naar het kleinste getal in de grafiek. Des te hoger dat getal is, des te toevalliger. 
In principe zou je alleen mogen kijken naar de getallen die kleiner zijn dan 0,05 (vanwege de betrouwbaarheid). 
In de tabel boven de grafiek, zie je dezelfde coefficienten. Daar zie je dat de kleinste waarde (van de p-value = betrouwbaarheid) hoort bij de hoogste waarden van de tau (=correlatie) bij RNR en RCF. De Cash Flow is dus de beste voorspeller voor de RNR.
2008-11-10 12:41:52 [Pieter Broos] [reply] 
juiste techniek gebruikt maar foutief afgelezen. 
de tau waarde geeft de correlatie weer, deze waarde moet dus zo hoog mogelijk zijn terwijl de p-value de betrouwbaarheid van de correlatie weergeeft, en deze p-value is best zo laag mogelijk.  
Als we kijken naar de combinatie van de hoogste tau waarde en de kleinste p-value komen we uit bij tau ( RNR , RCF )
2008-11-11 10:39:31 [Jens Peeters] [reply] 
De berekening klopt maar de redenering is foutief. De p-value moet zo laag mogelijk zijn. Als de waarde lager is dan 0.05 dan is deze betrouwbaar, dit is het geval bij tau( RNVM , RNR ).
2008-11-11 19:06:10 [Hidde Van Kerckhoven] [reply] 
De student heeft de juiste techniek gebruikt namelijk Kendall tau Correlation plot. Dit is een goede maatstaf voor correlatie. Ook de outliers worden in deze techniek gerelativeerd. De student heeft wel verkeerde conclusies getrokken. Als we een diagonaal trekken door de grafieken, kunnen we boven de rechte de correlatie terugvinden, onder de rechte vinden we de toevalligheid terug. et is de bedoeling de toevalligheid zo klein mogelijk te houden (onder 0.5). Dit is het geval bij tau( RNVM , RNR ). De Cash Flow is de beste voorspeller voor de RNR hier is de toevalligheid slechts 1%
2008-11-11 20:08:56 [Liese Tormans] [reply] 
Ik heb gebruik gemaakt van de juiste techniek. 
 
De Kendall Tau correlation: deze grafiek gaat alle correlaties bereken, de datasets ordenen en benoemen om later de rangen met mekaar te vergelijken 
 
Mijn redenering was echter wel foutief.  
Als ik kijk naar de grafiek zie ik dat deze opgesplitst is in twee delen namelijk kleine grafieken die iets meer vertellen over de correlatie en getalwaarden die iets vertellen over het betrouwbaarheidsintervallen.  
 
We kunnen spreken van een goede correlatie als er een rechte lijn (een vlakke lijn) te zien. Dit is het geval bij het eerste grafiekje van de twee rij bovenaan te beginnen. 
 
Bij de betrouwbaarheidsintervallen ga ik kijken naar de kleinste waarde, hoe kleiner de waarde hoe betrouwbaarder en hoe groter de waarde hoe minder betrouwbaar dus hoe toevalliger. 
  
Het beste is dat de waardes onder de 0,05 liggen, we kunnen dan spreken van een grote betrouwbaarheid. 
 
Op de grafiek kan ik zien dat we een waarde hebben van 0,03 bij RNVM , RNR. Maar dat er nog een kleinere waarde is namelijk 0,01 bij RNR , RCF. Ik kan dus stellen dat RCF (cash flow eigen vermogen) de beste predictor is voor RNR. 
 
Deze waardes zijn ook af te lezen in de tabel. 

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

4.2	4.8	20.8	0.9	39.6
2.6	-4.2	17.1	0.85	36.1
3	1.6	22.3	0.83	34.4
3.8	5.2	25.1	0.84	33.4
4	9.2	27.7	0.85	34.8
3.5	4.6	24.9	0.83	33.7
4.1	10.6	29.5	0.83	36.3

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	1 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=21159&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=21159&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=21159&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	1 seconds
R Server	'Gwilym Jenkins' @ 72.249.127.135

Kendall tau rank correlations for all pairs of data series
pair	tau	p-value
tau( RNVM , RNR )	0.714285714285714	0.0301587301587301
tau( RNVM , RCF )	0.523809523809524	0.136111111111111
tau( RNVM , RLEZ )	0.264628062012482	0.427262856745706
tau( RNVM , REV )	0.333333333333333	0.381349206349206
tau( RNR , RCF )	0.80952380952381	0.0107142857142857
tau( RNR , RLEZ )	-0.0529256124024963	0.873844698517373
tau( RNR , REV )	0.0476190476190476	1
tau( RCF , RLEZ )	-0.264628062012482	0.427262856745706
tau( RCF , REV )	-0.142857142857143	0.772619047619048
tau( RLEZ , REV )	0.370479286817474	0.266379923342483

\begin{tabular}{lllllllll}
\hline
Kendall tau rank correlations for all pairs of data series \tabularnewline
pair & tau & p-value \tabularnewline
tau( RNVM , RNR ) & 0.714285714285714 & 0.0301587301587301 \tabularnewline
tau( RNVM , RCF ) & 0.523809523809524 & 0.136111111111111 \tabularnewline
tau( RNVM , RLEZ ) & 0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RNVM , REV ) & 0.333333333333333 & 0.381349206349206 \tabularnewline
tau( RNR , RCF ) & 0.80952380952381 & 0.0107142857142857 \tabularnewline
tau( RNR , RLEZ ) & -0.0529256124024963 & 0.873844698517373 \tabularnewline
tau( RNR , REV ) & 0.0476190476190476 & 1 \tabularnewline
tau( RCF , RLEZ ) & -0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RCF , REV ) & -0.142857142857143 & 0.772619047619048 \tabularnewline
tau( RLEZ , REV ) & 0.370479286817474 & 0.266379923342483 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=21159&T=1

[TABLE]
[ROW][C]Kendall tau rank correlations for all pairs of data series[/C][/ROW]
[ROW][C]pair[/C][C]tau[/C][C]p-value[/C][/ROW]
[ROW][C]tau( RNVM , RNR )[/C][C]0.714285714285714[/C][C]0.0301587301587301[/C][/ROW]
[ROW][C]tau( RNVM , RCF )[/C][C]0.523809523809524[/C][C]0.136111111111111[/C][/ROW]
[ROW][C]tau( RNVM , RLEZ )[/C][C]0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RNVM , REV )[/C][C]0.333333333333333[/C][C]0.381349206349206[/C][/ROW]
[ROW][C]tau( RNR , RCF )[/C][C]0.80952380952381[/C][C]0.0107142857142857[/C][/ROW]
[ROW][C]tau( RNR , RLEZ )[/C][C]-0.0529256124024963[/C][C]0.873844698517373[/C][/ROW]
[ROW][C]tau( RNR , REV )[/C][C]0.0476190476190476[/C][C]1[/C][/ROW]
[ROW][C]tau( RCF , RLEZ )[/C][C]-0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RCF , REV )[/C][C]-0.142857142857143[/C][C]0.772619047619048[/C][/ROW]
[ROW][C]tau( RLEZ , REV )[/C][C]0.370479286817474[/C][C]0.266379923342483[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=21159&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=21159&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Kendall tau rank correlations for all pairs of data series
pair	tau	p-value
tau( RNVM , RNR )	0.714285714285714	0.0301587301587301
tau( RNVM , RCF )	0.523809523809524	0.136111111111111
tau( RNVM , RLEZ )	0.264628062012482	0.427262856745706
tau( RNVM , REV )	0.333333333333333	0.381349206349206
tau( RNR , RCF )	0.80952380952381	0.0107142857142857
tau( RNR , RLEZ )	-0.0529256124024963	0.873844698517373
tau( RNR , REV )	0.0476190476190476	1
tau( RCF , RLEZ )	-0.264628062012482	0.427262856745706
tau( RCF , REV )	-0.142857142857143	0.772619047619048
tau( RLEZ , REV )	0.370479286817474	0.266379923342483

Figure 1

PNG link

Postscript link

PDF link

Parameters (Session):

Parameters (R input):

R code (references can be found in the software module):

panel.tau <- function(x, y, digits=2, prefix='', cex.cor)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(0, 1, 0, 1))
rr <- cor.test(x, y, method='kendall')
r <- round(rr$p.value,2)
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep='')
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex)
}
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='grey', ...)
}
bitmap(file='test1.png')
pairs(t(y),diag.panel=panel.hist, upper.panel=panel.smooth, lower.panel=panel.tau, main=main)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Kendall tau rank correlations for all pairs of data series',3,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'pair',1,TRUE)
a<-table.element(a,'tau',1,TRUE)
a<-table.element(a,'p-value',1,TRUE)
a<-table.row.end(a)
n <- length(y[,1])
n
cor.test(y[1,],y[2,],method='kendall')
for (i in 1:(n-1))
{
for (j in (i+1):n)
{
a<-table.row.start(a)
dum <- paste('tau(',dimnames(t(x))[[2]][i])
dum <- paste(dum,',')
dum <- paste(dum,dimnames(t(x))[[2]][j])
dum <- paste(dum,')')
a<-table.element(a,dum,header=TRUE)
r <- cor.test(y[i,],y[j,],method='kendall')
a<-table.element(a,r$estimate)
a<-table.element(a,r$p.value)
a<-table.row.end(a)
}
}
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code