Free Statistics

of Irreproducible Research!

Author's title

Author*The author of this computation has been verified*
R Software Modulerwasp_edauni.wasp
Title produced by softwareUnivariate Explorative Data Analysis
Date of computationSat, 25 Oct 2008 07:08:49 -0600
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Oct/25/t12249401716dj5hnrijwfx2me.htm/, Retrieved Sun, 19 May 2024 13:09:29 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=18718, Retrieved Sun, 19 May 2024 13:09:29 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact499
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Explorative Data Analysis] [Investigation Dis...] [2007-10-21 17:06:37] [b9964c45117f7aac638ab9056d451faa]
F R  D  [Univariate Explorative Data Analysis] [univariate explor...] [2008-10-23 12:34:55] [077ffec662d24c06be4c491541a44245]
F           [Univariate Explorative Data Analysis] [] [2008-10-25 13:08:49] [6d40a467de0f28bd2350f82ac9522c51] [Current]
F   P         [Univariate Explorative Data Analysis] [] [2008-10-25 14:19:35] [4c8dfb519edec2da3492d7e6be9a5685]
F   P           [Univariate Explorative Data Analysis] [] [2008-10-25 14:25:52] [4c8dfb519edec2da3492d7e6be9a5685]
F                 [Univariate Explorative Data Analysis] [] [2008-10-27 08:04:13] [077ffec662d24c06be4c491541a44245]
F               [Univariate Explorative Data Analysis] [] [2008-10-27 08:02:47] [077ffec662d24c06be4c491541a44245]
Feedback Forum
2008-10-29 14:16:16 [Siem Van Opstal] [reply
De student geeft niet duidelijk voor welke assumptie hij welke techniek gebruikt. Assumption 1: Hiervoor bekijken we de lag plot. Op de grafiek van lag plot (k=1) kan je duidelijk zien dat er geen correlatie is. De punten liggen sterk verspreid rond de rechte. Bij lag plot (k=12) zien we wel een positieve correlatie. Iedere 12de maand krijgen we een forse stijging. Dat duidt op seizonaliteit.
Assumption 2: Op het Histogram kunnen we zien dat het verloop dicht bij normaalverdeling ligt. Enkel de slag links verloopt niet volgens een normaalverdeling maar die is verwaarloosbaar. Ook via de Normal Q-Q Plot kunnen we dat aflezen. De rechte stelt de theoretische kwantielen voor die je zou hebben bij een perfecte normaalverdeling. Je merkt duidelijk dat de werkelijke kwantielen zeer dicht bij die rechte liggen.
Assumption 3: http://www.freestatistics.org/blog/date/2008/Oct/28/t1225209651cyo5qox9zg4nafd.htm
Om constant te zijn zou de run sequence plot niet mogen fluctueren en er zitten wel veel schommelingen in. We kunnen ook controleren of het gemiddelde constant is. Daarvoor moeten we de gegevens reproduceren in de central tendency module. Ook daar is het moeilijk af te lezen, er doet zich vermoedelijk een dalende trend voor op lange termijn.
Assumption 4:
Er is geen gelijke spreiding. In het eerst deel van de reeks zien we een bredere spreiding dan in het tweede deel. We kunnen dus stellen dat er geen vaste spreiding is.
2008-10-30 14:14:12 [Christy Masson] [reply
ik denk dat de student voor mij al duidelijk alles heeft aangegeven en uitgelegd
2008-10-30 15:21:27 [2df1bcd103d52957f4a39bd4617794c8] [reply
Assumptie 1 De analyse van de lagplot was aan de orde. Er is géén correlatie aangezien de punten op de grafiek ver van de rechte liggen verwijderd.

Assumptie 2: Histogram of densety plot. Hieruit kunnen we de normaalverdeling concluderen. Ook het QQ plot zou hier kunnen gebruikt worden waarbij op de yas de quantiles worden weergegeven en op de x as de theoretische quantilen bij een perfecte normaalverdeling. Ook hier liggen de gegevens dicht bij de rechte en dus concluderen we een normaalverdeling.

Assumptie 3: run sequence plot op LT. Op lange termijn stellen we een lichte daling van de gegevens vast. Er is dus geen sprake van een constante locatie.

Assumptie 4: We bekijken de spreiding over de tijd heen. Er is geen vast patroon waar te nemen daar deze verschilt in tijd.

Post a new message
Dataseries X:
109.20
88.60
94.30
98.30
86.40
80.60
104.10
108.20
93.40
71.90
94.10
94.90
96.40
91.10
84.40
86.40
88.00
75.10
109.70
103.00
82.10
68.00
96.40
94.30
90.00
88.00
76.10
82.50
81.40
66.50
97.20
94.10
80.70
70.50
87.80
89.50
99.60
84.20
75.10
92.00
80.80
73.10
99.80
90.00
83.10
72.40
78.80
87.30
91.00
80.10
73.60
86.40
74.50
71.20
92.40
81.50
85.30
69.90
84.20
90.70
100.30




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 4 seconds \tabularnewline
R Server & 'Herman Ole Andreas Wold' @ 193.190.124.10:1001 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18718&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]4 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Herman Ole Andreas Wold' @ 193.190.124.10:1001[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18718&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18718&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time4 seconds
R Server'Herman Ole Andreas Wold' @ 193.190.124.10:1001







Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7

\begin{tabular}{lllllllll}
\hline
Descriptive Statistics \tabularnewline
# observations & 61 \tabularnewline
minimum & 66.5 \tabularnewline
Q1 & 80.6 \tabularnewline
median & 87.3 \tabularnewline
mean & 86.8934426229508 \tabularnewline
Q3 & 94.1 \tabularnewline
maximum & 109.7 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=18718&T=1

[TABLE]
[ROW][C]Descriptive Statistics[/C][/ROW]
[ROW][C]# observations[/C][C]61[/C][/ROW]
[ROW][C]minimum[/C][C]66.5[/C][/ROW]
[ROW][C]Q1[/C][C]80.6[/C][/ROW]
[ROW][C]median[/C][C]87.3[/C][/ROW]
[ROW][C]mean[/C][C]86.8934426229508[/C][/ROW]
[ROW][C]Q3[/C][C]94.1[/C][/ROW]
[ROW][C]maximum[/C][C]109.7[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=18718&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=18718&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Descriptive Statistics
# observations61
minimum66.5
Q180.6
median87.3
mean86.8934426229508
Q394.1
maximum109.7



Parameters (Session):
par1 = 0 ; par2 = 0 ;
Parameters (R input):
par1 = 0 ; par2 = 0 ;
R code (references can be found in the software module):
par1 <- as.numeric(par1)
par2 <- as.numeric(par2)
x <- as.ts(x)
library(lattice)
bitmap(file='pic1.png')
plot(x,type='l',main='Run Sequence Plot',xlab='time or index',ylab='value')
grid()
dev.off()
bitmap(file='pic2.png')
hist(x)
grid()
dev.off()
bitmap(file='pic3.png')
if (par1 > 0)
{
densityplot(~x,col='black',main=paste('Density Plot bw = ',par1),bw=par1)
} else {
densityplot(~x,col='black',main='Density Plot')
}
dev.off()
bitmap(file='pic4.png')
qqnorm(x)
qqline(x)
grid()
dev.off()
if (par2 > 0)
{
bitmap(file='lagplot1.png')
dum <- cbind(lag(x,k=1),x)
dum
dum1 <- dum[2:length(x),]
dum1
z <- as.data.frame(dum1)
z
plot(z,main='Lag plot (k=1), lowess, and regression line')
lines(lowess(z))
abline(lm(z))
dev.off()
if (par2 > 1) {
bitmap(file='lagplotpar2.png')
dum <- cbind(lag(x,k=par2),x)
dum
dum1 <- dum[(par2+1):length(x),]
dum1
z <- as.data.frame(dum1)
z
mylagtitle <- 'Lag plot (k='
mylagtitle <- paste(mylagtitle,par2,sep='')
mylagtitle <- paste(mylagtitle,'), and lowess',sep='')
plot(z,main=mylagtitle)
lines(lowess(z))
dev.off()
}
bitmap(file='pic5.png')
acf(x,lag.max=par2,main='Autocorrelation Function')
grid()
dev.off()
}
summary(x)
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Descriptive Statistics',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'# observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'minimum',header=TRUE)
a<-table.element(a,min(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q1',header=TRUE)
a<-table.element(a,quantile(x,0.25))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'median',header=TRUE)
a<-table.element(a,median(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'mean',header=TRUE)
a<-table.element(a,mean(x))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Q3',header=TRUE)
a<-table.element(a,quantile(x,0.75))
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'maximum',header=TRUE)
a<-table.element(a,max(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')