Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_pairs.wasp
Title produced by softwareKendall tau Correlation Matrix
Date of computationMon, 03 Nov 2008 13:08:34 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/03/t12257429822xas95ez3lwbwib.htm/, Retrieved Sun, 19 May 2024 12:15:56 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=21159, Retrieved Sun, 19 May 2024 12:15:56 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact237
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Kendall tau Correlation Matrix] [Q1 Deel 2] [2008-11-02 14:26:58] [4300be8b33fd3dcdacd2aa9800ceba23]
F         [Kendall tau Correlation Matrix] [statistiek 4 deel...] [2008-11-03 20:08:34] [2ba2a74112fb2c960057a572bf2825d3] [Current]
Feedback Forum
2008-11-09 15:01:47 [Bob Leysen] [reply
Goede grafiek.

De getallen in de rechthoeken zeggen niet wat correlatie is, dit is de betrouwbaarheid van uw correlatie. Hoe hoger het getal, hoe meer louter toeval.
De tweede kolom (RNR) is het meest betrouwbaar (0,01).
2008-11-10 08:49:34 [Davy De Nef] [reply
De studente maakt gebruik van de juiste software, namelijk de Kendall Tau Correlation plot. Dat is een goede maatstaf voor correlatie.
Om van excel naar deze methode te komen, heeft de student eerst de rijen en kolommen van plaats verwisseld. Dit is nodig omdat de variabelen bovenaan staan (als kolom).
De interpretatie van de grafiek gebeurd op een foutieve manier.
Boven de diagonaal die je kan trekken doorheen de grafieken, zie je kleine grafiekjes die de correlatie weergeven. Een goede correlatie lezen we af als er een stijgende rechte te zien is (zonder al teveel pieken).
Onder die diagonaal zie je de betrouwbaarheid. Het is dan ook de bedoeling om te gaan kijken naar het kleinste getal in de grafiek. Des te hoger dat getal is, des te toevalliger.
In principe zou je alleen mogen kijken naar de getallen die kleiner zijn dan 0,05 (vanwege de betrouwbaarheid).
In de tabel boven de grafiek, zie je dezelfde coefficienten. Daar zie je dat de kleinste waarde (van de p-value = betrouwbaarheid) hoort bij de hoogste waarden van de tau (=correlatie) bij RNR en RCF. De Cash Flow is dus de beste voorspeller voor de RNR.
2008-11-10 12:41:52 [Pieter Broos] [reply
juiste techniek gebruikt maar foutief afgelezen.
de tau waarde geeft de correlatie weer, deze waarde moet dus zo hoog mogelijk zijn terwijl de p-value de betrouwbaarheid van de correlatie weergeeft, en deze p-value is best zo laag mogelijk.
Als we kijken naar de combinatie van de hoogste tau waarde en de kleinste p-value komen we uit bij tau ( RNR , RCF )
2008-11-11 10:39:31 [Jens Peeters] [reply
De berekening klopt maar de redenering is foutief. De p-value moet zo laag mogelijk zijn. Als de waarde lager is dan 0.05 dan is deze betrouwbaar, dit is het geval bij tau( RNVM , RNR ).
2008-11-11 19:06:10 [Hidde Van Kerckhoven] [reply
De student heeft de juiste techniek gebruikt namelijk Kendall tau Correlation plot. Dit is een goede maatstaf voor correlatie. Ook de outliers worden in deze techniek gerelativeerd. De student heeft wel verkeerde conclusies getrokken. Als we een diagonaal trekken door de grafieken, kunnen we boven de rechte de correlatie terugvinden, onder de rechte vinden we de toevalligheid terug. et is de bedoeling de toevalligheid zo klein mogelijk te houden (onder 0.5). Dit is het geval bij tau( RNVM , RNR ). De Cash Flow is de beste voorspeller voor de RNR hier is de toevalligheid slechts 1%
2008-11-11 20:08:56 [Liese Tormans] [reply
Ik heb gebruik gemaakt van de juiste techniek.

De Kendall Tau correlation: deze grafiek gaat alle correlaties bereken, de datasets ordenen en benoemen om later de rangen met mekaar te vergelijken

Mijn redenering was echter wel foutief.
Als ik kijk naar de grafiek zie ik dat deze opgesplitst is in twee delen namelijk kleine grafieken die iets meer vertellen over de correlatie en getalwaarden die iets vertellen over het betrouwbaarheidsintervallen.

We kunnen spreken van een goede correlatie als er een rechte lijn (een vlakke lijn) te zien. Dit is het geval bij het eerste grafiekje van de twee rij bovenaan te beginnen.

Bij de betrouwbaarheidsintervallen ga ik kijken naar de kleinste waarde, hoe kleiner de waarde hoe betrouwbaarder en hoe groter de waarde hoe minder betrouwbaar dus hoe toevalliger.

Het beste is dat de waardes onder de 0,05 liggen, we kunnen dan spreken van een grote betrouwbaarheid.

Op de grafiek kan ik zien dat we een waarde hebben van 0,03 bij RNVM , RNR. Maar dat er nog een kleinere waarde is namelijk 0,01 bij RNR , RCF. Ik kan dus stellen dat RCF (cash flow eigen vermogen) de beste predictor is voor RNR.

Deze waardes zijn ook af te lezen in de tabel.

Post a new message
Dataseries X:
4.2	4.8	20.8	0.9	39.6
2.6	-4.2	17.1	0.85	36.1
3	1.6	22.3	0.83	34.4
3.8	5.2	25.1	0.84	33.4
4	9.2	27.7	0.85	34.8
3.5	4.6	24.9	0.83	33.7
4.1	10.6	29.5	0.83	36.3




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 1 seconds \tabularnewline
R Server & 'Gwilym Jenkins' @ 72.249.127.135 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=21159&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]1 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Gwilym Jenkins' @ 72.249.127.135[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=21159&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=21159&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time1 seconds
R Server'Gwilym Jenkins' @ 72.249.127.135







Kendall tau rank correlations for all pairs of data series
pairtaup-value
tau( RNVM , RNR )0.7142857142857140.0301587301587301
tau( RNVM , RCF )0.5238095238095240.136111111111111
tau( RNVM , RLEZ )0.2646280620124820.427262856745706
tau( RNVM , REV )0.3333333333333330.381349206349206
tau( RNR , RCF )0.809523809523810.0107142857142857
tau( RNR , RLEZ )-0.05292561240249630.873844698517373
tau( RNR , REV )0.04761904761904761
tau( RCF , RLEZ )-0.2646280620124820.427262856745706
tau( RCF , REV )-0.1428571428571430.772619047619048
tau( RLEZ , REV )0.3704792868174740.266379923342483

\begin{tabular}{lllllllll}
\hline
Kendall tau rank correlations for all pairs of data series \tabularnewline
pair & tau & p-value \tabularnewline
tau( RNVM , RNR ) & 0.714285714285714 & 0.0301587301587301 \tabularnewline
tau( RNVM , RCF ) & 0.523809523809524 & 0.136111111111111 \tabularnewline
tau( RNVM , RLEZ ) & 0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RNVM , REV ) & 0.333333333333333 & 0.381349206349206 \tabularnewline
tau( RNR , RCF ) & 0.80952380952381 & 0.0107142857142857 \tabularnewline
tau( RNR , RLEZ ) & -0.0529256124024963 & 0.873844698517373 \tabularnewline
tau( RNR , REV ) & 0.0476190476190476 & 1 \tabularnewline
tau( RCF , RLEZ ) & -0.264628062012482 & 0.427262856745706 \tabularnewline
tau( RCF , REV ) & -0.142857142857143 & 0.772619047619048 \tabularnewline
tau( RLEZ , REV ) & 0.370479286817474 & 0.266379923342483 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=21159&T=1

[TABLE]
[ROW][C]Kendall tau rank correlations for all pairs of data series[/C][/ROW]
[ROW][C]pair[/C][C]tau[/C][C]p-value[/C][/ROW]
[ROW][C]tau( RNVM , RNR )[/C][C]0.714285714285714[/C][C]0.0301587301587301[/C][/ROW]
[ROW][C]tau( RNVM , RCF )[/C][C]0.523809523809524[/C][C]0.136111111111111[/C][/ROW]
[ROW][C]tau( RNVM , RLEZ )[/C][C]0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RNVM , REV )[/C][C]0.333333333333333[/C][C]0.381349206349206[/C][/ROW]
[ROW][C]tau( RNR , RCF )[/C][C]0.80952380952381[/C][C]0.0107142857142857[/C][/ROW]
[ROW][C]tau( RNR , RLEZ )[/C][C]-0.0529256124024963[/C][C]0.873844698517373[/C][/ROW]
[ROW][C]tau( RNR , REV )[/C][C]0.0476190476190476[/C][C]1[/C][/ROW]
[ROW][C]tau( RCF , RLEZ )[/C][C]-0.264628062012482[/C][C]0.427262856745706[/C][/ROW]
[ROW][C]tau( RCF , REV )[/C][C]-0.142857142857143[/C][C]0.772619047619048[/C][/ROW]
[ROW][C]tau( RLEZ , REV )[/C][C]0.370479286817474[/C][C]0.266379923342483[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=21159&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=21159&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Kendall tau rank correlations for all pairs of data series
pairtaup-value
tau( RNVM , RNR )0.7142857142857140.0301587301587301
tau( RNVM , RCF )0.5238095238095240.136111111111111
tau( RNVM , RLEZ )0.2646280620124820.427262856745706
tau( RNVM , REV )0.3333333333333330.381349206349206
tau( RNR , RCF )0.809523809523810.0107142857142857
tau( RNR , RLEZ )-0.05292561240249630.873844698517373
tau( RNR , REV )0.04761904761904761
tau( RCF , RLEZ )-0.2646280620124820.427262856745706
tau( RCF , REV )-0.1428571428571430.772619047619048
tau( RLEZ , REV )0.3704792868174740.266379923342483



Parameters (Session):
Parameters (R input):
R code (references can be found in the software module):
panel.tau <- function(x, y, digits=2, prefix='', cex.cor)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(0, 1, 0, 1))
rr <- cor.test(x, y, method='kendall')
r <- round(rr$p.value,2)
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep='')
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex)
}
panel.hist <- function(x, ...)
{
usr <- par('usr'); on.exit(par(usr))
par(usr = c(usr[1:2], 0, 1.5) )
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col='grey', ...)
}
bitmap(file='test1.png')
pairs(t(y),diag.panel=panel.hist, upper.panel=panel.smooth, lower.panel=panel.tau, main=main)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Kendall tau rank correlations for all pairs of data series',3,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'pair',1,TRUE)
a<-table.element(a,'tau',1,TRUE)
a<-table.element(a,'p-value',1,TRUE)
a<-table.row.end(a)
n <- length(y[,1])
n
cor.test(y[1,],y[2,],method='kendall')
for (i in 1:(n-1))
{
for (j in (i+1):n)
{
a<-table.row.start(a)
dum <- paste('tau(',dimnames(t(x))[[2]][i])
dum <- paste(dum,',')
dum <- paste(dum,dimnames(t(x))[[2]][j])
dum <- paste(dum,')')
a<-table.element(a,dum,header=TRUE)
r <- cor.test(y[i,],y[j,],method='kendall')
a<-table.element(a,r$estimate)
a<-table.element(a,r$p.value)
a<-table.row.end(a)
}
}
a<-table.end(a)
table.save(a,file='mytable.tab')