Estatistika deskribatzailea: ariketak/Kontzentrazioa, pobrezia neurriak eta entropia

Wikibooks(e)tik
Hona jo: nabigazioa, bilatu
Lorenzen kurba eratzeko txantiloia. R kodea ikusteko, egin klik irudiaren gainean. Lau grafika dituen orri bat eskuratzeko, Crystal Clear mimetype pdf.pnghemen sakatu eta, ondoren, berriz ere sakatu.
1: Eskualde batean familien urteko errentari buruzko inkesta egin da, datu hauek jasoz milaka eurotan:
15.2-26.5-24.3-45.0-12.3-21.3-30.5-28.6-42.8-26.4

Lorenzen kurba marraztu behar da.

Galdera hauek erantzun:

  • errenta osotik zenbat hartzen du familien %20 pobreenak?;
  • errenta osotik zenbat hartzen du familien %10 aberatsenak?


> install.packages("ineq")
> library(ineq)
> x=c(15.2,26.5,24.3,45.0,12.3,21.3,30.5,28.6,42.8,26.4)
> Lc(x)
$p
 [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
$L
 [1] 0.00000000 0.04507145 0.10076951 0.17882008 0.26786369 0.36460242
 [7] 0.46170759 0.56650788 0.67827043 0.83510443 1.00000000
$L.general
 [1]  0.00  1.23  2.75  4.88  7.31  9.95 12.60 15.46 18.51 22.79 27.29
attr(,"class")
[1] "Lc"
> plot(Lc(x),col=c("red"),lwd=3)


2: Enpresa batek bost denda ditu hiri batean. Bi urtetan zehar izandako salmentak jaso dira:


2010: 12-18-22-26-36
2011: 10-16-22-40-52

Lorenzen kurbak marraztu diagrama berean eta emaitzak interpretatu.


> x10=c(12,18,22,26,36)
> x11=c(10,16,22,40,52)
> Lc(x10)
$p
[1] 0.0 0.2 0.4 0.6 0.8 1.0
$L
[1] 0.0000000 0.1052632 0.2631579 0.4561404 0.6842105 1.0000000
> Lc(x11)
$p
[1] 0.0 0.2 0.4 0.6 0.8 1.0
$L
[1] 0.00000000 0.07142857 0.18571429 0.34285714 0.62857143 1.00000000
> plot(Lc(x10),col=c("red"),lwd=4)
> lines(Lc(x11),col=c("green"),lwd=4)
3: Bi urtetan zehar familien urteko errentari buruzko inkesta bat egin da datu hauek jasoz:
2010: 10-15-22-26-29-32-35-40-52-80
2011: 8-12-20-22-36-38-40-48-55-70


Bi urtetako Lorenzen kurbak marraztu diagrama berean. Diagraman oinarrituz soilik baiezta al daiteke kontzentrazioa igo ala jeitsi den?

Zein urtetan dira pobreenak pobreago?

Giniren indizea kalkulatu bi urtetarako eta emaitzak interpretatu.

Kalkulatu mediala bi urteetarako eta emaitzak interpretatu.

Kalkulatu Robin Hood adierazlea bi urteetarako eta emaitzak interpretatu.

Kalkulatu bi urteetarako 20:20 ratioa eta Palma ratioa eta emaitzak interpretatu.

> x10=c(10,15,22,26,29,32,35,40,52,80)
> x11=c(8,12,20,22,36,38,40,48,55,70)
> plot(Lc(x10),col=c("red"),lwd=4)
> lines(Lc(x11),col=c("green"),lwd=4)
4: Donostian eta Iruñean errentari buruzko inkesta bat egin zaie familiei:
Donostia: 8-10-11-12-15-20-27
Iruñea: 3-5-13-14-20-26

Kalkulatu Iruñeko pobreziaren intentsitatea eta pobreziaren neurri orokor bat, pobrezia mugatzat 15 harturik.

Pobrezia muga medianaren %80a da bi hirietan. Erantzun galdera hauek:

  1. Zein hiritan daude pobre gehiago?
  2. Zein hiritan da handiagoa pobreziaren intentsitatea?
  3. Zein hiritan dago, oro har, pobrezia handiagoa?


5: 2008 eta 2011an 15-24 urte bitarteko gazteen artean zein telefono mugikor marka galdetu zitzaien:
2008: A (80), B (60), C (10), D (30) eta E (20)
2011: A (150), B (40), C (10), D (30), E (40), F (20)

Zein urtetan izan zen merkatua anitzagoa?

Zein urtetan izan du merkatuak izaera oligopolistiko nabarmenagoa?

Aurretik aurreikus al zitezkeen emaitza horiek?



> install.packages("DiversitySampler")
> library(DiversitySampler)
> x08=c(80,60,10,30,20)
> x10=c(150,40,10,30,40,20)
> Hs(x08)
[1] 1.392321
> Hs(x10)
[1] 1.422701


6: Ordenagailu portatilen merkatuan 2009 eta 2011 urteetan sektoreko enpresen artean izandako fakturazioaren banaketa (milaka unitatetan) agertzen da ondoren:
2009: A (100), B (50), C (80), D (20) eta E (10)
2011: A (60), B (40), C (30), D (40), E (40), F (60), G (50)

Zein urtetan du merkatuak izaera oligopolistiko nabarmenagoa?


7: Errenta-inkesta batean honako datu hauek jaso dira:
8-12-17-24-36

Kontzentrazio neurri gisa hau proposatu da:

Kontzentrazioaren axiomatikako eskala-aldaketari buruzko baldintza betetzen al du? Horretarako, datuak 2 balioaz bidertu eta kontzentrazio neurriaren balioa aldaketaren aurretik eta ondoren aztertu behar duzu.
Jatorri-aldaketari buruzko baldintza betetzen al du? Horretarako, jatorriko datuei +10 eta -5 aldakuntzak aplikatu eta kontzentrazio-neurria datu zahar nahiz berriekin kalkulatu.

Eskala aldaketari buruzko axiomak eskala aldaketa baten ondorioz kontzentrazio neurriaren balioa ere ez dela aldatu behar ezartzen du. Hain zuzen, aldaketaren aurretik eta ondoren, kontzentrazioa benetan ez da aldatzen, p eta q balioak berdinak baitira, jarraian ikusten denez:

> library(ineq)
> x=c(8,12,24,17,36)
> Lc(x)
$p
[1] 0.0 0.2 0.4 0.6 0.8 1.0
$L
[1] 0.00000000 0.08247423 0.20618557 0.38144330 0.62886598 1.00000000
> Lc(2*x)
$p
[1] 0.0 0.2 0.4 0.6 0.8 1.0
$L
[1] 0.00000000 0.08247423 0.20618557 0.38144330 0.62886598 1.00000000

Kalkula dezagun K:

  • eskala aldaketaren aurretik:
    • ondoz ondoko errenten diferentzien batezbestekoa: [(12-8)+(17-12)+(24-17)+(36-24)]/4=7
    • errenten batezbestekoa: 19.4
    • K=7/19.4=0.36
  • eskala aldaketaren ondoren:
    • ondoz ondoko errenten diferentzien batezbestekoa: [(24-16)+(34-24)+(48-34)+(72-48)]/4=14
    • errenten batezbestekoa: 38.8
    • K=14/38.8=0.36

K aldatzen ez denez, eskala-aldaketaren axiomari buruz kontzentrazio-neurri egokia eta onargarria dela esan daiteke.

Datuei +10 eta -5 eginda, honako hauek dira suertatzen diren Lorenz kurbak, jatorrizkoarekin batera (gorriz):

Lorenz jatorri aldaketa.png

Beraz, +10 eginda, kontzentrazioa handitu egiten da; -5 eginda, gutxitu. Ikus dezagun, kontzentrazio-neurriak aldaketa hauek behar bezala jasotzen dituen:

  • +10 aldaketaren ondoren,
    • ondoz ondoko errenten diferentzien batezbestekoa, [(22-18)+(27-22)+(34-27)+(46-34)]/4=7,
    • errenten batezbestekoa, 29.4,
    • K=7/29.4=0.238.

Kontzentrazioaren neurria jeitsi egiten da, datuei +10 egin ondoren. Beraz, alde honetatik betetzen du jatorri-aldaketaren baldintza.

  • -5 aldaketaren ondoren,
    • ondoz ondoko errenten diferentzien batezbestekoa, [(7-3)+(12-7)+(19-12)+(31-19)]/4=7,
    • errenten batezbestekoa, 14.4,
    • K=7/14.4=0.486.

Kontzentrazioaren neurria igo egiten da, datuei -5 egin ondoren. Beraz, alde honetatik ere betetzen du jatorri-aldaketaren baldintza.

Jatorri-aldaketaren baldintza behar bezala betetzen du bi norabideetan.


8: Errenta-inkesta batean honako datu hauek jaso dira:
Errenta tartea Familiak (n)
0-10 10
10-50 30
50-100 10
Giniren koefizientea kalkulatu behar da.

Datuak tartetan daudenean, tarteko erdipuntua hartzen da erreferentzia moduan. Horrela egin ondoren, ez da beharrezkoa 40 familiei dagozkien pi eta qi balioak banaka ematea. Klase bakoitzean dauden familiek berdin jasotzen dutenez, familien horiei dagokien tartean Lorenz kurba zuzena izango da. Beraz, aski da hiru klaseei dagokien hiru puntuak kalkulatu eta puntu horiek zuzenez lotzea. Giniren koefizientearen kalkulua ere hiru puntu horietatik egin daiteke, 40 familien ordez 3 klaseak soilik hartuz.

Errenta tartea Familiak (n) xi (errenta balioa) nxi (errenta totala) Errenta total metatuak qi (% errenta) Familia metatuak pi (% familiak)
0-10 10 5 50 50 0.0322 10 0.2
10-50 30 25 750 800 0.5161 40 0.8
50-100 10 75 750 1550 1 50 1

Lorenz kurbako pi,qi puntu adierazgarriak edukita, Giniren koefizientearen adierazpena honela kalkulatzen da:


pi (% errenta) qi (% familiak) (pi-pi-1)(qi+qi-1)
0.2 0.0322 (0.2-0)×(0.0322+0)=0.00644
0.8 0.5161 (0.8-0.2)×(0.5161+0.0322)=0.32898
1 1 (1-0.8)×(1+0.5161)=0.30322


pi (% errenta) qi (% familiak) pi-qi
0.2 0.0322 0.1678
0.8 0.5161 0.2839
1 1 0