Free Statistics

of Irreproducible Research!

Author's title

Author*Unverified author*
R Software Modulerwasp_univariatedataseries.wasp
Title produced by softwareUnivariate Data Series
Date of computationSat, 29 Nov 2008 04:37:02 -0700
Cite this page as followsStatistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?v=date/2008/Nov/29/t1227958645395gic2ypmuliag.htm/, Retrieved Sun, 19 May 2024 04:21:36 +0000
Statistical Computations at FreeStatistics.org, Office for Research Development and Education, URL https://freestatistics.org/blog/index.php?pk=26219, Retrieved Sun, 19 May 2024 04:21:36 +0000
QR Codes:

Original text written by user:
IsPrivate?No (this computation is public)
User-defined keywords
Estimated Impact224
Family? (F = Feedback message, R = changed R code, M = changed R Module, P = changed Parameters, D = changed Data)
F     [Univariate Data Series] [Airline data] [2007-10-18 09:58:47] [42daae401fd3def69a25014f2252b4c2]
F    D    [Univariate Data Series] [Q5] [2008-11-29 11:37:02] [d41d8cd98f00b204e9800998ecf8427e] [Current]
Feedback Forum
2008-12-07 11:16:14 [Kelly Deckx] [reply
Ik heb de vragen hier door elkaar gehaald, en ik ben de lamda berekenignen vergeten te maken. Die heb ik dan nu wel gemaakt: http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/07/t1228648298au86adxbt1qgn35.htm

de standard-deviation mean plot geeft het verband weer tussen de standaarddeviatie en het gemiddelde van de tijdreeks. Wanneer er een duidelijke positieve of negatieve correlatie bestaat dan zijn de standaardfouten geen constanten en is er dus geen sprake van een stationaire tijdreeks. Hier is duidelijk een positieve relatie te zien, dus is de tijdreeks niet stationair. Om een stationaire tijdreeks te verkrijgen, nemen we de waarde -0,3 voor lambda

Bij de grafiek had ik ook nog kunnen vermelden dat de spreiding niet constant is, daarom kunnen we besluiten dat de tijdreeks niet stationair is.
2008-12-07 20:48:20 [Jasmine Hendrikx] [reply
Evaluatie Q5:
Deze vraag is eigenlijk verkeerd opgelost. Het antwoord en de berekeningen die zijn gegeven, behoren tot Q6. Vandaar dat ik in de volgende URL’s die nog in het document staan bij Q5 niets geschreven heb op het feedback forum. In Q5 moet je enkel de optimale lambda berekenen door de volgende methode te gebruiken: Standard Deviation –Mean Plot. Op het einde van de vraag is wel correct gezegd dat de optimale labmda -0.3 moet zijn, maar hoe men hier aan is gekomen is nergens terug te vinden. Hieronder staat de URL van hetgeen je zou moeten bekomen.
http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/01/t1228160341yfg8r4x0jndxzav.htm
Bij de Standard Deviation – Mean Plot wordt de tijdreeks in mootjes gehakt. In de eerste tabel krijgen we voor het eerste jaar en voor de volgende jaren steeds het gemiddelde en de standaardafwijking. In de laatste kolom zien we de range (dit is het verschil tussen de grootste en kleinste waarde). De grafiek geeft het verband weer tussen het gemiddelde niveau en de standaardafwijking. Op de x-as zien we het gemiddelde en op de y-as de standaardafwijking. We moeten hier goed opletten op outliers, zeker wanneer deze zich links of rechts bevinden, aangezien zij de helling dan sterk zullen beïnvloeden. Uit de grafiek kunnen we afleiden dat er geen sprake is van outliers en zien we een mooi positief verband tussen het gemiddelde en de standaardafwijking. We zien uit de tweede tabel dat bèta gelijk is aan 0,19. Dit getal is significant verschillend van 0, doordat de p-waarde afgerond 0 bedraagt. De p-waarde is dus zelfs kleiner dan 1%, waardoor we kunnen zeggen dat er minder dan 1% kans is dat we ons vergissen bij het verwerpen van de nulhypothese. De helling is dus significant verschillend van 0 en het positieve verband tussen het gemiddelde en de standaardafwijking is dus niet aan het toeval te wijten. Er is wel degelijk een verband tussen het gemiddelde en de standaardafwijking. In de derde tabel krijg je dit in logaritmische vorm. Je vindt hier een theoretische lambda die je kan gebruiken in de transformatie. Indien lambda gelijk is aan 0, dan gebruiken we een logaritme, indien lambda verschillend is van 0, dan gebruiken we een exponent. We zien uit de vorige tabel dat er een verband bestaat tussen het gemiddelde en de standaardafwijking, daarom mogen we dus de waarde van lambda nemen die berekend is. We zoeken deze lambda om de variantie te stabiliseren en zo de tijdreeks meer stationair te maken.
2008-12-08 19:49:27 [Koen Van Baelen] [reply
De opgave werd niet goed begrepen. Hier vind men de correcte oplossing: http://www.freestatistics.org/blog/index.php?v=date/2008/Dec/02/t1228234369ugi870lzb9uzyoe.htm De lamba berekenen doen we door de standard deviation plot. Deze verdeelt de reeks onder in perioden. In de grafiek zie je punten die de jaren voorstellen. Dit keer heeft de student wel de seasonal period op 12 geplaatst. De x-as = het gemiddelde en y-as = standard deviation. Door een lambda toe te voegen kan men de tijdreeks transformeren waardoor de spreiding harder naar een diagonaal zal deinen. Een lambda van 1 geeft bijvoorbeeld een perfecte rechte. De bedoeling van deze transformatie is om een tijdreeks met gelijke spreidingen te bekomen en dus een stationaire tijdreeks te bekomen. Hier voor moet je zien dat de spreiding gelijk loopt door de tijd en hierdoor wordt de trend eruit gehaald. De optimale lambda is dan -0.312592539725757. Ook kan er dan nog een opmerking worden gemaakt over de heterokedasticiteit. We hebben gezien op de run sequence plot dat er sprake was van heteroskedasticiteit : de variantie werd groter naarmate de tijd vordert. De gegevens in de standard deviation mean plot bevestigden dit. Ook de p value (6.19e-11) is kleiner dan 0.05 wat de heteroskedasticiteit bevestigt. We gaan de tijdreeks tot de 0.3e macht vereffenen om deze heteroskedastische trend weg te werken. Ons model zal volgende vorm aannemen: Nabla^d nabla^D(Yt)^-0.3=et

Post a new message
Dataseries X:
112
118
132
129
121
135
148
148
136
119
104
118
115
126
141
135
125
149
170
170
158
133
114
140
145
150
178
163
172
178
199
199
184
162
146
166
171
180
193
181
183
218
230
242
209
191
172
194
196
196
236
235
229
243
264
272
237
211
180
201
204
188
235
227
234
264
302
293
259
229
203
229
242
233
267
269
270
315
364
347
312
274
237
278
284
277
317
313
318
374
413
405
355
306
271
306
315
301
356
348
355
422
465
467
404
347
305
336
340
318
362
348
363
435
491
505
404
359
310
337
360
342
406
396
420
472
548
559
463
407
362
405
417
391
419
461
472
535
622
606
508
461
390
432




Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24

\begin{tabular}{lllllllll}
\hline
Summary of computational transaction \tabularnewline
Raw Input & view raw input (R code)  \tabularnewline
Raw Output & view raw output of R engine  \tabularnewline
Computing time & 2 seconds \tabularnewline
R Server & 'Sir Ronald Aylmer Fisher' @ 193.190.124.24 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=26219&T=0

[TABLE]
[ROW][C]Summary of computational transaction[/C][/ROW]
[ROW][C]Raw Input[/C][C]view raw input (R code) [/C][/ROW]
[ROW][C]Raw Output[/C][C]view raw output of R engine [/C][/ROW]
[ROW][C]Computing time[/C][C]2 seconds[/C][/ROW]
[ROW][C]R Server[/C][C]'Sir Ronald Aylmer Fisher' @ 193.190.124.24[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=26219&T=0

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=26219&T=0

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Summary of computational transaction
Raw Inputview raw input (R code)
Raw Outputview raw output of R engine
Computing time2 seconds
R Server'Sir Ronald Aylmer Fisher' @ 193.190.124.24







Univariate Dataseries
Name of dataseriesAirline
SourceBox-Jenkins
DescriptionAirline Passengers
Number of observations144

\begin{tabular}{lllllllll}
\hline
Univariate Dataseries \tabularnewline
Name of dataseries & Airline \tabularnewline
Source & Box-Jenkins \tabularnewline
Description & Airline Passengers \tabularnewline
Number of observations & 144 \tabularnewline
\hline
\end{tabular}
%Source: https://freestatistics.org/blog/index.php?pk=26219&T=1

[TABLE]
[ROW][C]Univariate Dataseries[/C][/ROW]
[ROW][C]Name of dataseries[/C][C]Airline[/C][/ROW]
[ROW][C]Source[/C][C]Box-Jenkins[/C][/ROW]
[ROW][C]Description[/C][C]Airline Passengers[/C][/ROW]
[ROW][C]Number of observations[/C][C]144[/C][/ROW]
[/TABLE]
Source: https://freestatistics.org/blog/index.php?pk=26219&T=1

Globally Unique Identifier (entire table): ba.freestatistics.org/blog/index.php?pk=26219&T=1

As an alternative you can also use a QR Code:  

The GUIDs for individual cells are displayed in the table below:

Univariate Dataseries
Name of dataseriesAirline
SourceBox-Jenkins
DescriptionAirline Passengers
Number of observations144



Parameters (Session):
par1 = Airline ; par2 = Box-Jenkins ; par3 = Airline Passengers ;
Parameters (R input):
par1 = Airline ; par2 = Box-Jenkins ; par3 = Airline Passengers ;
R code (references can be found in the software module):
bitmap(file='test1.png')
plot(x,col=2,type='b',main=main,xlab=xlab,ylab=ylab)
dev.off()
load(file='createtable')
a<-table.start()
a<-table.row.start(a)
a<-table.element(a,'Univariate Dataseries',2,TRUE)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Name of dataseries',header=TRUE)
a<-table.element(a,par1)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Source',header=TRUE)
a<-table.element(a,par2)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Description',header=TRUE)
a<-table.element(a,par3)
a<-table.row.end(a)
a<-table.row.start(a)
a<-table.element(a,'Number of observations',header=TRUE)
a<-table.element(a,length(x))
a<-table.row.end(a)
a<-table.end(a)
table.save(a,file='mytable.tab')