Repository of Reproducible Computations

Free Statistics

of Irreproducible Research!

Author's title

Author

*Unverified author*

R Software Module

rwasp_univariatedataseries.wasp

Title produced by software

Univariate Data Series

Date of computation

Sat, 29 Nov 2008 04:37:02 -0700

Cite this page as follows

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/29/t1227958645395gic2ypmuliag.htm/, Retrieved Sun, 19 May 2024 04:21:36 +0000

Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=26219, Retrieved Sun, 19 May 2024 04:21:36 +0000

QR Codes:

Paste this QR Code to cite your computation.

Original text written by user:

IsPrivate?

No (this computation is public)

User-defined keywords

Estimated Impact

224

Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)

F     [Univariate Data Series] [Airline data] [2007-10-18 09:58:47] [42daae401fd3def69a25014f2252b4c2]
F    D    [Univariate Data Series] [Q5] [2008-11-29 11:37:02] [d41d8cd98f00b204e9800998ecf8427e] [Current]

Feedback Forum

2008-12-07 11:16:14 [Kelly Deckx] [reply] 
Ik heb de vragen hier door elkaar gehaald, en ik ben de lamda berekenignen vergeten te maken. Die heb ik dan nu wel gemaakt: http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/07/t1228648298au86adxbt1qgn35.htm 
 
de standard-deviation mean plot geeft het verband weer tussen de standaarddeviatie en het gemiddelde van de tijdreeks. Wanneer er een duidelijke positieve of negatieve correlatie bestaat dan zijn de standaardfouten geen constanten en is er dus geen sprake van een stationaire tijdreeks. Hier is duidelijk een positieve relatie te zien, dus is de tijdreeks niet stationair. Om een stationaire tijdreeks te verkrijgen, nemen we de waarde -0,3 voor lambda  
 
Bij de grafiek had ik ook nog kunnen vermelden dat de spreiding niet constant is, daarom kunnen we besluiten dat de tijdreeks niet stationair is. 
2008-12-07 20:48:20 [Jasmine Hendrikx] [reply] 
Evaluatie Q5: 
Deze vraag is eigenlijk verkeerd opgelost. Het antwoord en de berekeningen die zijn gegeven, behoren tot Q6. Vandaar dat ik in de volgende URL’s die nog in het document staan bij Q5 niets geschreven heb op het feedback forum. In Q5 moet je enkel de optimale lambda berekenen door de volgende methode te gebruiken: Standard Deviation –Mean Plot. Op het einde van de vraag is wel correct gezegd dat de optimale labmda -0.3 moet zijn, maar hoe men hier aan is gekomen is nergens terug te vinden. Hieronder staat de URL van hetgeen je zou moeten bekomen.  
http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/01/t1228160341yfg8r4x0jndxzav.htm 
Bij de Standard Deviation – Mean Plot wordt de tijdreeks in mootjes gehakt. In de eerste tabel krijgen we voor het eerste jaar en voor de volgende jaren steeds het gemiddelde en de standaardafwijking. In de laatste kolom zien we de range (dit is het verschil tussen de grootste en kleinste waarde). De grafiek geeft het verband weer tussen het gemiddelde niveau en de standaardafwijking. Op de x-as zien we het gemiddelde en op de y-as de standaardafwijking. We moeten hier goed opletten op outliers, zeker wanneer deze zich links of rechts bevinden, aangezien zij de helling dan sterk zullen beïnvloeden. Uit de grafiek kunnen we afleiden dat er geen sprake is van outliers en zien we een mooi positief verband tussen het gemiddelde en de standaardafwijking.  We zien uit de tweede tabel dat bèta gelijk is aan 0,19. Dit getal is significant verschillend van 0, doordat de p-waarde afgerond 0 bedraagt. De p-waarde is dus zelfs kleiner dan 1%, waardoor we kunnen zeggen dat er minder dan 1% kans is dat we ons vergissen bij het verwerpen van de nulhypothese. De helling is dus significant verschillend van 0 en het positieve verband tussen het gemiddelde en de standaardafwijking is dus niet aan het toeval te wijten. Er is wel degelijk een verband tussen het gemiddelde en de standaardafwijking. In de derde tabel krijg je dit in logaritmische vorm. Je vindt hier een theoretische lambda die je kan gebruiken in de transformatie. Indien lambda gelijk is aan 0, dan gebruiken we een logaritme, indien lambda verschillend is van 0, dan gebruiken we een exponent. We zien uit de vorige tabel dat er een verband bestaat tussen het gemiddelde en de standaardafwijking, daarom mogen we dus de waarde van lambda nemen die berekend is. We zoeken deze lambda om de variantie te stabiliseren en zo de tijdreeks meer stationair te maken.  
2008-12-08 19:49:27 [Koen Van Baelen] [reply] 
De opgave werd niet goed begrepen. Hier vind men de correcte oplossing: http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/02/t1228234369ugi870lzb9uzyoe.htm De lamba berekenen doen we door de standard deviation plot. Deze verdeelt de reeks onder in perioden. In de grafiek zie je punten die de jaren voorstellen. Dit keer heeft de student wel de seasonal period op 12 geplaatst. De x-as = het gemiddelde en y-as = standard deviation. Door een lambda toe te voegen kan men de tijdreeks transformeren waardoor de spreiding harder naar een diagonaal zal deinen. Een lambda van 1 geeft bijvoorbeeld een perfecte rechte. De bedoeling van deze transformatie is om een tijdreeks met gelijke spreidingen te bekomen en dus een stationaire tijdreeks te bekomen. Hier voor moet je zien dat de spreiding gelijk loopt door de tijd en hierdoor wordt de trend eruit gehaald. De optimale lambda is dan -0.312592539725757. Ook kan er dan nog een opmerking worden gemaakt over de heterokedasticiteit. We hebben gezien op de run sequence plot dat er sprake was van heteroskedasticiteit : de variantie werd groter naarmate de tijd vordert. De gegevens in de standard deviation mean plot bevestigden dit. Ook de p value (6.19e-11) is kleiner dan 0.05 wat de heteroskedasticiteit bevestigt. We gaan de tijdreeks tot de 0.3e macht vereffenen om deze heteroskedastische trend weg te werken. Ons model zal volgende vorm aannemen: Nabla^d nabla^D(Yt)^-0.3=et

Post a new message

Dataseries X:

Download CSV

Histogram

Boxplots

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=26219&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=26219&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=26219&T=0

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Input	view raw input (R code)
Raw Output	view raw output of R engine
Computing time	2 seconds
R Server	'Sir Ronald Aylmer Fisher' @ 193.190.124.24

Univariate Dataseries
Name of dataseries	Airline
Source	Box-Jenkins
Description	Airline Passengers
Number of observations	144

\begin{tabular}{lllllllll}
\hline
Univariate Dataseries \tabularnewline
Name of dataseries & Airline \tabularnewline
Source & Box-Jenkins \tabularnewline
Description & Airline Passengers \tabularnewline
Number of observations & 144 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=26219&T=1

[TABLE]
[ROW][C]Univariate Dataseries[/C][/ROW]
[ROW][C]Name of dataseries[/C][C]Airline[/C][/ROW]
[ROW][C]Source[/C][C]Box-Jenkins[/C][/ROW]
[ROW][C]Description[/C][C]Airline Passengers[/C][/ROW]
[ROW][C]Number of observations[/C][C]144[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=26219&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=26219&T=1

As an alternative you can also use a QR Code:

The GUIDs for individual cells are displayed in the table below:

Univariate Dataseries
Name of dataseries	Airline
Source	Box-Jenkins
Description	Airline Passengers
Number of observations	144

Figure 1

PNG link

Postscript link

PDF link

Parameters (Session):

par1 = Airline ; par2 = Box-Jenkins ; par3 = Airline Passengers ;

Parameters (R input):

par1 = Airline ; par2 = Box-Jenkins ; par3 = Airline Passengers ;

R code (references can be found in the software module):

bitmap(file='test1.png')
plot(x,col=2,type='b',main=main,xlab=xlab,ylab=ylab)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Univariate Dataseries',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Name of dataseries',header=TRUE)
a<-table.element(a,par1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Source',header=TRUE)
a<-table.element(a,par2)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Description',header=TRUE)
a<-table.element(a,par3)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Number of observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')

Free Statistics

Description of Statistical Computation

Tree of Dependent Computations

Dataset

Tables (Output of Computation)

Figures (Output of Computation)

Input Parameters & R Code