Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationFri, 24 Oct 2008 10:12:22 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/24/t1224864786nlcj3bxdfraqcih.htm/, Retrieved Sun, 19 May 2024 14:33:34 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18644, Retrieved Sun, 19 May 2024 14:33:34 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact153
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F    D    [Univariate Explorative Data Analysis] [Q2 inv distr] [2008-10-24 16:12:22] [1b288879226ab9a3cab0c803857233cc] [Current]
F    D      [Univariate Explorative Data Analysis] [steenkool] [2008-10-27 18:31:50] [8545382734d98368249ce527c6558129]
-    D        [Univariate Explorative Data Analysis] [steenkool sept 20...] [2008-10-27 18:46:16] [8545382734d98368249ce527c6558129]
Feedback Forum
2008-11-03 08:50:51 [8e2cc0b2ef568da46d009b2f601285b2] [reply
Je hebt in het document uitgelegd welke methode en aangehaald dat er 4 verschillende assumpties zijn zonder deze te herbekijken.
De oplossing in de voorbeeld opgave van Q2 is fout, de student bekijkt de verkeerde plots.

De correcte plots zijn:
assumptie 1: lag plot bij lag 12, autocorrelatie functie
assumptie 2: density plot, q-q plot
assumptie 3: run sequence plot
assumptie 4: run sequence plot

Je hebt ook geen lags ingesteld hierdoor zijn de laatste 2 grafieken (lag plots) niet aangemaakt. De lag stel je best in op 12 of 36.
2008-11-03 21:44:04 [Carl Heselmans] [reply
Net zoals de student hierboven al zei heb je de verkeerde plots gebruikt, ik wou er ook nog toevoegen dat je bij assumptie 2 ook het histogram kan gebruiken.
2008-12-01 19:08:27 [8e2cc0b2ef568da46d009b2f601285b2] [reply
Deze vraag is niet herberekend, de student bespreekt eerder dat je 4 assumpties moet testen en met welke software. Indien de student het wel opnieuw had uitgewerkt had hij mogelijk opgemerkt dat het gegeven antwoord fouten bevatte. Bij Q2 werd namelijk naar de verkeerde plots gezien en de lags waren niet ingevuld.

De voorbeeld student is vergeten de lags in te stellen deze kunnen het best op 12 of 36 ingesteld worden.

Assumptie 1: De voorbeeld student heeft de foutieve grafiek bekeken, om deze assumptie te controlleren moeten we de lagplot bekijken. Bij lag 12 vinden we een positieve seizonale correlatie.

Assumptie 2: De voorbeeld student heeft de foutieve grafieken bekeken (2 niet 3 Density wel), hier moest de Q-Q en de density plot gebruikt worden. We kunnen een niet uitgesproken bult in de density plot vinden. Diezelfde bult vinden we terug in de Q-Q plot toch liggen deze punten voldoende dicht tegen de normale theoretische quantiele om over een normale verdeling te spreken

Assumptie 3: De voorbeeld student heeft hier ook de foutieve grafiek afgelezen, de te gebruike grafiek was de Run sequence plot en deze op lange termijn te beoordelen. De conclusie is hier, moeilijk te zien we vermoeden een dalende lijn.

Assumptie 4: Deze vraag werd ook fout beantwoord. Je hebt hiervoor niet de lag-plot nodig. De run sequency plot vertelt je genoeg. Als je deze grafiek in 2 splitst, zie je dat de spreiding in het 1ste deel groter is dan in het 2de deel.
De vraag heeft ook betrekking op de random component, dus je kan bij het berekenen de R-module veranderen nl. x = -0,86... (het gemiddelde)dus dan trek je de voorspelling af en zie je nog beter dat de spreiding niet dezelfde is.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'George Udny Yule' @ 72.249.76.132 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18644&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'George Udny Yule' @ 72.249.76.132[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18644&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18644&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'George Udny Yule' @ 72.249.76.132







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18644&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18644&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18644&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main=paste('Lag plot, lowess, and regression line'))
lines(lowess(z))
abline(lm(z))
dev.off()
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')