Estatistika deskribatzailea: ariketak/Denbora serieen analisirako sarrera

Wikibookstik
Hona jauzi: nabigazioa, bilatu
1: Sektore ekonomiko batean lan egiten zuten pertsonen kopuruari buruzko datuak dira hileko honako hauek, 2004 urteko maiatzetik hasita:
12,14,16,13,19,17,16,20,18,19,20,21,18,20,22,24,26,23,27,29,30,34,28,32,31,30,29,30,33

3, 6 eta 9 tamainako batezbesteko higikorrak kalkulatu eta jatorriko denbora seriearekin batera diagrama batean irudikatu behar dira. Diagrama interpreta ezazu.

kopuru=c(12,14,16,13,19,17,16,20,18,19,20,21,18,20,22,24,26,23,27,29,30,34,28,32,31,30,29,30,33)
denborakopuru=ts(kopuru,start=c(2004,5),frequency=12)
denbora kopuru


2: Jantzi denda batean izandako salmentak jaso dira hiruhileko batzuetan zehar, 2004 urtetik hasita:
67,46,72,44,70,50,72,43,69,48,66,51,74,55,64,48,67,50

2 eta 4 tamainako batezbesteko higikorrak kalkulatu eta jatorriko denbora seriearekin batera diagrama batean irudikatu behar dira. Diagrama interpreta ezazu.


3: Denda batean izandako salmentak jasotzen dira ondoren, hiruhilekoz hiruhileko, 2002 urteko lehenengo hiruhilekotik hasita:
21,26,30,18,22,28,31,19,21,29,32,18,23,25,32,20

Urtarokotasuna identifikatu denbora serieko datuetan eta horiei dagokien diagraman eta ezabatu batezbesteko higikor egoki baten bitartez. Goranzko joerarik ba al dago?


4: Sektore bateko lanpostuen kopuruaren bilakaerari buruzko datuak agertzen dira ondoren, 1990 urtetik hasita eta seihileko datuak harturik:
13,22,18,29,21,33,16,25,20,32,24,38,11,29,22,33,25,40,19,30,21,34,26,38

Denbora seriea grafikoki irudikatu eta identifikatu joera, urtarokotasun, ziklo eta hondar osagaiak, horretarako batezbesteko higikor egokiak kalkulatuz.


Irudirako R kodea, hemen.


5: Denbora serie honen 4 tamainuko batezbesteko higikorrak kalkulatu, ezagunak diren bi eratara, kalkulatu eta grafikoki irudikatu seriearekin batera.
18,13,9,26,21,19,14,30,23,20,17,29,22,18,17,30
Bi batezbesteko higikorren arteko ezberdintasuna aipatu eta emaitzak interpretatu.

Batezbesteko higikorrak kalkulatzeko bi metodoak hauek dira:

  • batezbesteko bakoitza sartzen den azken balioaren parean jartzen da;
  • batezbesteko bakoitza erdiko balioaren parean jartzen da, eta datu kopurua bikoitia bada, aurrekoan.

Bi metodo horien arabera kalkuluak eta ondorengo grafikoa burutzeko R kodea hau da:

>x=c(18,13,9,26,21,19,14,30,23,20,17,29,22,18,17,30)
> denbora=ts(x)
> library(RSvgDevice)
> devSVG("puntuhodeia_0001.svg")
> plot(denbora)
> bh4a=filter(denbora,side=1,rep(1/4,4))
> lines(bh4a,col="red")
> bh4b=filter(denbora,side=2,rep(1/4,4))
> lines(bh4b,col="green")
> dev.off()
> bh4a
Time Series:
Start = 1 
End = 16 
Frequency = 1 
[1]    NA    NA    NA 16.50 17.25 18.75 20.00 21.00 21.50 21.75 22.50 22.25
[13] 22.00 21.50 21.50 21.75
> bh4b
Time Series:
Start = 1 
End = 16 
Frequency = 1 
[1]    NA 16.50 17.25 18.75 20.00 21.00 21.50 21.75 22.50 22.25 22.00 21.50
[13] 21.50 21.75    NA    NA
Movingaverage twomethods 001.svg

Bi metodoek ematen dituzten balioak berberak dira: batezbesteko higikorren balioan azkenen parean jartzen direnean, seriea aurreratu soilik egiten da, kasu honetan 2 aldi, emaitzetan ikus daitekeenez. Seriearen ikuspegi zuzenena ematen duen metodoa zentratzearena bada: irudian ikus daitekeenez, batezbesteko zentratuek serieak duen aldi beretsuan dute gailurra; batezbestekoa amaieran jartzen denean, berriz, atzerapena gertatzen da (kasu honetan, gorriz, gailurra seriean baino beranduxeago gertatzen dela ikus daiteke). Teknika zenbaitek, ordea, batezbestekoa amaieran jartzen delako prozedura eskatzen dute.

Grafikoaren interpretazioari buruz, oro har bi aldiroko mugimendua dago (igo, jeitsi, igo, jeitsi, ...), 2 tamainako batezbesteko higikor batekin ezabatu eta joera garbia utziko lukeena. Kalkulatzen den 4 tamainakoa batezbesteko higikorrak ere aldirokotasun hau ezabatzen du, noski, irudian ikus daitekeenez.


Leunketa esponentziala[aldatu]

Leunketa esponentziala aldi bateko eta horren aurreko aldi guztietako balioak barnehartzen dituen batezbesteko higikor haztatu bat da, zenbat eta aterago joan, hainbat eta haztapen txikiagoak ezartzen dituena.

0-1 bitarteko parametro bat da, erabakitzaileak finkatzen duena.

2012ko ekainean hasitako hileko denbora serie hau aztertu behar da:

12,14,11,15,13,18,12,10,17

Alfa=0.7 parametroa harturik, burutu ezazu leunketa esponentziala. Berdin egin ezazu Alfa=0.2 parametroa harturik. Zein parametro-baliorekin leuntzen da gehien?

Balioei ematen zaizkien haztapenak kalkula itzazu, aurreko bi kasuetan, azken baliotik hasita. Emaitzak alderatu.

Zein da 18 balioko gertaera apartekoaren eragina leunketan aurreko bi kasuetan.

Aurresanak burutu aurreko bi kasuetarako.

Zein da aurreko bietatik alfa parametro egokiena?


> x=c(12,14,11,15,13,18,12,10,17)
>denb=ts(x,start=c(2010,6),frequency=12)
>leun1=HoltWinters(denb,alpha=0.7,beta=FALSE,gamma=FALSE)
>leun1 #ez du guretzat informazio handirik ematen
>leun1$fitted #aurresanak kalkulatu
>leun1$SSE #errore karratuen batura kalkulatu
>leun2=HoltWinters(denb,beta=FALSE,gamma=FALSE,l.start=13) #alfa zehaztu gabe, alfa egokiena aukeratzen du, l.start aukerak inizializazio balio jakin bat zehazteko aukera ematen du
>leun2 #alfa zehaztu ez denez, alfa egokiena ematen du
>leun2$fitted #alfa egokieneko aurresanak
>leun2$SSE #alfa egokieneko errore karratuen batura

Osagaien bereizketa[aldatu]


6: Lauhilabete batzuetan zehar denda bateko salmentak jaso dira:
Lauhilabetea \ Urtea 2006 2007 2008 2009
I 26 36 40 42
II 32 44 46 46
III 22 34 34 40

Denbora seriearen osagaien bereizketa burutu eta salmentei urtarokotasuna ezabatu behar zaie.

Urte bakoitzeko lauhilekoetako datuen batezbestekoak eta desbideratze estandarrak, hurrenez hurren, hauek dira:

  • 2006:26.6; 4.10
  • 2007:38; 4.32
  • 2008:40; 4.89
  • 2009:42.6; 2.49
> salmentak=c(26,32,22,36,44,34,40,46,34,42,46,40)
> seriea=ts(salmentak,start=c(2006,1),frequency=3)
> bh3=filter(seriea,side=2,rep(1/3,3))
> bh3
Time Series:
Start = c(2006, 1) 
End = c(2009, 3) 
Frequency = 3 
 [1]       NA 26.66667 30.00000 34.00000 38.00000 39.33333 40.00000 40.00000
 [9] 40.66667 40.66667 42.66667       NA
> seriea-bh3
Time Series:
Start = c(2006, 1) 
End = c(2009, 3) 
Frequency = 3 
 [1]        NA  5.333333 -8.000000  2.000000  6.000000 -5.333333  0.000000
 [8]  6.000000 -6.666667  1.333333  3.333333        NA
7: Hiruhilabete batzuetan zehar denda bateko salmentak jaso dira:
Hiruhilabetea \ Urtea 2007 2008 2009
I 12 18 22
II 18 27 35
III 36 50 60
IV 26 35 42

Denbora seriearen osagaien bereizketa burutu eta salmentei urtarokotasuna ezabatu behar zaie.

Urte bakoitzeko lauhilekoetako datuen batezbestekoak eta desbideratze estandarrak, hurrenez hurren, hauek dira:

  • 2007:23; 9
  • 2008:32.5; 11.75
  • 2009:39.5; 13.71
> denb=ts(c(12,18,36,26,18,27,50,35,22,35,60,42),start=c(2007,1),frequency=4)
> bh4=filter(denb,side=2,rep(1/4,4))
> bh4
      Qtr1  Qtr2  Qtr3  Qtr4
2007    NA 23.00 24.50 26.75
2008 30.25 32.50 33.50 35.50
2009 38.00 39.75    NA    NA
8: Jatetxe batek ostegunetik larunbatera zabaltzen ditu bere ateak. Maiatzan zehar hau izan zen fakturazioaren bilakaera (eguna: fakturazioa; maiatzaren 2a osteguna izan zen):
2: 234, 3: 321, 4: 432, 9: 265, 10: 333, 11: 419 16: 245, 17: 356, 18: 451, 23: 267, 24: 341, 25: 461.

Denbora seriearen osagaien bereizketa burutu behar da. Azken asteko zein egunetan fakturatu zen gehien astegunaren efektua ezabatu ondoren?

Urtean zehar urtaro batetik bestera adierazten den serie baten moduan aztertzeko, astea urte eta asteguna urtaro balira bezala hartu behar dira.

> fakt=c(234,321,432,265,333,419,245,356,451,267,341,461)
> denbseriea=ts(fakt,start(1,1),frequency=3)
> denbseriea
Time Series:
Start = c(1, 1) 
End = c(4, 3) 
Frequency = 3 
 [1] 234 321 432 265 333 419 245 356 451 267 341 461

Deflaktazioa[aldatu]

Salmentak, erosketak, soldatak eta beste aldagai ekonomikoak moneta-unitate nominaletan neurtzen dira, hau da une bakoitzeko prezioetan. Prezioen igoera dela eta, kopuru nominal horiek ez dute behar bezala adierazten errealki zenbat saldu den edo fisikoki zenbat eskuratu daitekeen (soldaten kasuan) edo saldu den (salmenten kasuan). Aldi desberdinetako kopuru ekonomikoak alderatzeko kopuru nominalak kopuru erreal (urte jakin bateko prezio edo euro konstantetara) bihurtu behar dira, hau da, inflazioaren eragina ezabatu egin behar zaie. Kopuru nominaletatik kopuru errealetara aldatzeko eragiketari deflaktazio deritzo. Deflaktatzeko inflazioaren bilakaera adierazten duten indize bat, deflaktatzaile izenekoa, behar da (hobe kopuru nominal horrekin loturik badago). Deflaktatzerakoan, kopuru errealak zein aldiko prezio konstantetan jarri nahi diren ere adierazi behar da, zein urtera deflaktatu nahi den alegia. Deflaktatzailea kopuru nominalean barneratzen diren produktuen prezioen-indize bat erabili ohi da.

Prezioen-indizea prezioen bilakaera adierazten duen balio-segida bat da, une batzuetan zehar; hasierako uneari oinarri deritzo eta orduan indizeak 100 balioa hartzen du. Aukeratutako saski edo produktu multzoaren prezio totala oinarri-unean 100 dela suposatuz, indizeak prezioen bilakaera adierazten du.

9: Euskal Herriko familien elikagai-gastuaren bilakaera zehazten da ondoren, elikagaien prezioen indizearekin batera:
Urtea 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Elikagai-gastua 27 26 28 29 32 34 33 36 35 31 29
Prezio indizeak - - 100 105 111 115 119 122 124 127 132

Gastua 2005 urteko euro konstanteetara deflaktatu. Zein urtetan kontsumitu zen gehien urte horretako prezio konstanteetan?

Zenbat izan beharko lirateke salmenta nominalak 2008 urtean 2005 urteko salmenten berdinak izateko termino errealetan?

2009 eta 2010 urteetarako prezio indizeak 138 eta 142 izatea espero bada, zenbat izan behar dira salmentak urte horietan 2008ko salmentak baino %10 eta %15 handiagoak, hurrenik hurren, izateko termino errealetan?

Gastua 2005 urteko euro konstanteetara deflaktatu. Zein urtetan kontsumitu zen gehien urte horretako prezio konstanteetan?

2005 urteko prezioetara deflaktatzeko, prezio-indizeen oinarria 2005 urtera aldatu behar da (hau da, 2005: 100). Beste indizeen balioa proportzioan aldatuko da; beraz, aski izango da hirukoaren erregela sinple bat indize berriak kalkulatzeko (laburrago, (indize zaharra/122)*100):

Urtea 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Prezio indizeak - - 81.97 86.07 90.98 94.26 97.54 100 101.64 104.10 108.20

Kopuru errealak, gastua 2005eko prezio konstantetan alegia, honela kalkulatuko dira:

kopuru erreala=(kopuru nominala/prezio indizea)*100
Urtea 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
Kopuru errealak - - 34.16 33.7 35.17 36.07 33.83 36 (noski!) 34.44 29.78 26.80

2003 urtean izan zen elikagaia gastu erreal handiena.

Zenbat izan beharko lirateke gastu nominalak 2008 urtean 2005 urteko salmenten berdinak izateko termino errealetan?

Indizeei erreparatuta, 2008 urtean prezioak %8.2 igo dira 2005 urteari buruz (100tik 108.2ra). Beraz, gastu erreal berdina izateko, gastu nominala proportzio berean igo beharko litzateke: 36 * 1.082=38.952.

2009 eta 2010 urteetarako prezio indizeak 138 eta 142 izatea espero bada, zenbat izan behar dira gastuak urte horietan 2008ko gastuak baino %10 eta %15 handiagoak, hurrenik hurren, izateko termino errealetan?

2008ko gastu errealak 2005eko prezioetan 26.80 izan dira. 2009 eta 2010ean %10 eta %15 handiagoak izateko, 26.80*1.1=29.48 eta 26.80*1.15=30.82 izan behar dira urte horietako gastu errealak, 2005eko prezioetan betiere.

Gastuak nominalki zenbat izan behar diren jakiteko, 2009 eta 2010eko indizeak 2005eko oinarrira aldatu behar dira lehenbizi, 2009 eta 2010eko gastu errealak urte horretako prezioetan ditugulako:

2009: (138/122)*100=113.11 / 2010: (142/122)*100=116.39

Eta ondoren, indizeek adierazten dituzten prezio igoera horiek aplikatu:

2009: 29.48*1.1311=33.34 / 2010: 30.82*1.1639=35.87


10: Euskal Herriko metal sektoreko salmentak eta metal produktuen prezio-indizearen bilakaera urte batzuetan zehar zehazten dira ondoren:
Urtea 2004 2005 2006 2007 2008 2009 2010 2011
Salmentak - - 87 96 112 118 124 131
Prezio indizeak - - 100 105 111 115 119 122

Salmentak 2010 urteko euro konstanteetara deflaktatu. Zein urtetan saldu zen gehien urte horretako prezioetan?

2012 urterako elikagaien prezioen indizea 129ra helduko dela aurresaten bada, zenbat saldu behar da aurreko urtearekin alderatuta salmentak berdin atxikitzeko prezio konstanteetan?


2010 urteko prezioetara deflaktatzeko, prezio indizeak 2010 urteko oinarrira aldatu behar dira. Hori 2007 urteko oinarria duten prezioetan hirukoaren erregela sinple bat burutuz egiten da. 2010 urterako deflaktazioa salmenta nominalak 2010 oinarriko prezio-indizeekin zatituz (batekoetan, ez ehunekotan) egiten da:

Urtea 2006 2007 2008 2009 2010 2011
Prezio indizeak (oinarria: 2006) 100 105 111 115 119 122
Prezio indizeak (oinarria: 2010) 84.0 88.2 93.2 96.8 100 102.5
Salmenta errealak (oinarria:2010) 87/0.84=103.5 108.8 120 122.4 124 127.8

Prezioen indizea 2012 urtean 129 heltzekoa bada, 2011 urtearekin alderatuz prezioak 129/122=1.057=%5.7 igo behar direla aurresaten dela esan nahi du. 2011 urtean 122 saldu zenez, termino erreal edo konstanteetan berdin atxikitzeko, salmenta nominalak 131*1.057=138.46 izan beharko direla esan nahi du.


11: Jantzi-denda bateko salmentak jaso dira:
Urtea 2008 2009 2010 2011
Salmentak 1200 1350 1450 1600
Prezio indizeak 100 110 115 122

Salmentak deflaktatu, era sinpleenean (hau da, kalkulu gutxienak eginez). Errealki gora egin al dute salmentek lau urteko epean?

2012 urterako %8ko prezio igoera espero bada, zenbat izan behar dira salmenta nominalak urte horretan, 2008ko salmenta errealen berdinak izateko?

Kalkulu gutxienak egin nahi badira, oinarri-aldaketarik ez da egingo indizean, hau da, 2008 urteko prezioetan jarriko dira salmentak.

Urtea 2008 2009 2010 2011
Salmenta errealak (oin:2008) 1200 1227 1260 1311

2012 urterako %8ko prezio-igoera espero bada, 2012ko prezioen indizea 122*1,08=131.76 izatea aurresaten dela esan nahi du. Orduko salmenta errealak 1200 izatea nahi denez, salmenta nominalak hauek izango dira: errealak*indizea=1200*1.3176=1581.12.