Estatistika deskribatzailea: ariketak/Aldagai kualitatiboen arteko erlazio estatistikoa: asoziazioa

Wikibooks(e)tik
Hona jauzi: nabigazioa, bilatu
1: Ikasgela birtual batean ikastaroa hasi zutenen sexua eta ikastaroa bukatu zuten jaso da (g: gizon, e: emakume / b: bai, e: ez):
Sexua e e g g e e g g e g e e g g e e g
Bukatu al zuen? b e e e b e b e b e e b e e b e b

Kontingentzia-taula osatu behar da. Maiztasunak modu absolutuan nahi erlatiboan eman itzazu. Portzentajeak interpretatu behar dira.


>sexua=c("e","e","g","g","e","e","g","g","e","g","e","e","g","g","e","e","g")
>bukatu=c("b","e","e","e","b","e","b","e","b","e","e","b","e","e","b","e","b")
>datuak=data.frame(sexua,bukatu)
>table(datuak)
     bukatu
sexua b e
    e 5 4
    g 2 6
>taula=table(datuak)
> margin.table(taula,1)
sexua
e g 
9 8 
> margin.table(taula,2)
bukatu
 b  e 
 7 10 
> margin.table(taula)
[1] 17

Taulako portzentajeak kalkulatzeko, berriz:

> prop.table(taula,1)
     bukatu
sexua         b         e
    e 0.5555556 0.4444444
    g 0.2500000 0.7500000
> prop.table(taula,2)
     bukatu
sexua         b         e
    e 0.7142857 0.4000000
    g 0.2857143 0.6000000
2: Kafetegi batera joaten diren bezeroen sexua eta tea edo kafea eskatu duten jaso dira. Emaitzak kontingentzia taula honetan jaso dira:
Tea Kafea
Gizon 186 332
Emakume 566 387

Taulako portzentajeak kalkulatu behar dira norabide bietan. Galdera hauek erantzun behar dira ondoren:

  • Kafea eskatzen duten bezeroei promozio-opari bat eskaini behar bazaie, zein sexutarako egin beharko litzateke bereziki?
  • Hiriko emakumeen artean sustapen-kanpaina bat zein produkturekin egin beharko litzateke?


3: Sexuari eta aukeratutako batxilergo-adarrari buruzko datuak jaso eta kontingentzia-taula batean bildu dira:
Zientziak Humanitateak Teknologia Guztira
Gizon 274 86 225 585
Emakume 312 165 186 663
Guztira 586 251 411 1248

Khi-karratuan oinarritutako asoziazio neurriak kalkulatu eta interpretatu. Asoziazioaren norabidea ere aztertu behar da, gelaskak behar den moduan koloreztatuz.


>taula=as.table(rbind(c(274,86,225),c(312,165,186))) #datuak sartu taula moduan eta "taula" izena eman
>install.packages("gmodels") #hurrengo agindurako beharrekzo paketea deskargatu
>library(gmodels) #hurrengo agindurako beharrezko paketea
>CrossTable(taula,expected=TRUE) #maiztasun teorikoak, khi karratuko batugaiak eta khi karratu kalkulatu
>install.packages("vcd") #hurrengo agindurako beharrezko paketea deskargatu
>library(vcd) #hurrengo agindurako beharrezko paketea
>assocstats(taula) #asoziazio-neurriak


4: 25 urteko gazteen artean lanean dauden eta ikasketa-maila galdetu zaie:
Derrigorrezko hezkuntza Lanbide Heziketa Unibertsitatea
Langabetua 265 238 386
Lanean 186 436 198

Lambda eta gamma (ahal bada) kalkulatu eta interpretatu.


5: 18-30 urte bitarteko gazteei darabilten mugikorraren marka eta kontratatuta duten operadorea galdetu zaizkie:
A operadorea B operadorea C operadorea GUZTIRA
Alfa marka 86 202 145 433
Beta marka 121 111 136 368
Gamma marka 44 108 168 320
GUZTIRA 251 421 449 1121

Lambda kalkulatu eta interpretatu.

Aldagai dependentea zein den garbi ez dagoenean, lambda bi norabideetan kalkulatzea da egokiena.


6: Lurrin-denda batean lurrin bat erosi duten 30-50 urte bitarteko emakume guztiei aurreko aldian zein lurrin marka erosi duten galdetu zaie, une horretan erosi duten lurrinaren marka jasotzearekin batera. Emaitzak hauek dira (zutabeetan oraingo marka, errenkadetan aurreko marka):
Dior Chanel Shiseido Loewe
Dior 46 58 21 16
Chanel 67 87 36 25
Shiseido 54 42 67 8
Loewe 13 25 45 98

Zein da bezeroen leialtasun handiena duen marka?

Khi-karratuan oinarritutako asoziazio-neurriak kalkulatu eta interpretatu, asoziazioa dakarten gelaskak eta euren asoziazio norabidea nabarmenduz.


Marka batekiko leialtasuna neurtzeko, lehen eta orain marka bat erosi dutenen portzentajea kalkulatu behar da, marka hori erosi zuten pertsonen kopuruarekiko. Horrela, leialtasuna l izendatuz:


Leialtasun handieneko marka Loewe da, non bezeroen %54 izaten den leiala ondoz ondoko erosketen artean.

Khi-karraturako kalkuluak egiten dira jarraian:

enpirikoa (e) Dior Chanel Shiseido Loewe GUZTIRA
teorikoa (t)
(e-t)/erro(t)
(e-t)2/t
Dior 46 58 21 16 141
35,8 42,2 33,6 29,3
1,7 2,4 -2,2 -2,4
2,9 5,9 4,8 6
Chanel 67 87 36 25 215
54,7 64,4 51,3 44,6
1,6 2,8 -2,1 -2,9
2,8 8 4,6 8,6
Shiseido 54 42 67 8 171
43,5 51,2 40,8 35,5
1,6 -1,2 4,1 -4,6
2,5 1,6 16,8 21,3
Loewe 13 25 45 98 181
46 54,2 43,2 37,6
-4,9 -4 0,3 9,8
23,7 15,7 0,1 97,1
GUZTIRA 180 212 169 147 708

Taula karratua denez, kontingentzia-koefiziente soila nahikoa da asoziazio neurtzeko:

Cramerren V kalkulatzen da jarraian:

Kontingentzia-koefizientearen zein Cramerren V neurriaren arabera, bi aldagaien arteko asoziazio ertaina dago, lagin errorearen erreserbapean eta antzeko ikerketak kontuan hartu gabe. Asoziazio ertain horren norabide nagusiak koloreztatutako gelaskek adierazten dituzte: Shiseidok eta Loewe bereziki leialtasun handiko markak dira, Shiseidoren kasuan Loeweren aukeraren kaltetan eta Loeweren kasuan, Dior aukeraren kaltetan.


7: Enpresa txiki, ertain eta handiei azken urtean euren mozkinak igo ala jaitsi diren galdetu zaie, ISO 9000 kalitate agiria dutenak eta ez dutenak bereiziz taula bietan:
ISO 9000 EZ DUTENAK
Mozkinak igo Mozkinak jaitsi Guztira
Txiki 126 15 141
Ertain 43 68 111
Handi 3 28 31
Guztira 172 111 283


ISO 9000 DUTENAK
Mozkinak igo Mozkinak jaitsi Guztira
Txiki 12 152 164
Ertain 64 50 114
Handi 23 2 25
Guztira 99 204 303

Bi tauletarako Crameren V eta lambda kalkulatu eta interpretatu. Ondoren, neurri horiek kalkulatu bi taulak bateratuta eta emaitzak interpretatu aurreko emaitzen aldean.


> taulaez=as.table(rbind(c(126,15),c(43,68),c(3,28)))

> library(gmodels)

> CrossTable(taulaez,expected=TRUE)

 
   Cell Contents
|-------------------------|
|                       N |
|              Expected N |
| Chi-square contribution |
|           N / Row Total |
|           N / Col Total |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  283 

 
             |  
             |         A |         B | Row Total | 
-------------|-----------|-----------|-----------|
           A |       126 |        15 |       141 | 
             |    85.696 |    55.304 |           | 
             |    18.955 |    29.372 |           | 
             |     0.894 |     0.106 |     0.498 | 
             |     0.733 |     0.135 |           | 
             |     0.445 |     0.053 |           | 
-------------|-----------|-----------|-----------|
           B |        43 |        68 |       111 | 
             |    67.463 |    43.537 |           | 
             |     8.871 |    13.745 |           | 
             |     0.387 |     0.613 |     0.392 | 
             |     0.250 |     0.613 |           | 
             |     0.152 |     0.240 |           | 
-------------|-----------|-----------|-----------|
           C |         3 |        28 |        31 | 
             |    18.841 |    12.159 |           | 
             |    13.319 |    20.638 |           | 
             |     0.097 |     0.903 |     0.110 | 
             |     0.017 |     0.252 |           | 
             |     0.011 |     0.099 |           | 
-------------|-----------|-----------|-----------|
Column Total |       172 |       111 |       283 | 
             |     0.608 |     0.392 |           | 
-------------|-----------|-----------|-----------|

 
Statistics for All Table Factors


Pearson's Chi-squared test 
------------------------------------------------------------
Chi^2 =  104.9002     d.f. =  2     p =  1.664188e-23



> taulabai=as.table(rbind(c(12,152),c(64,50),c(23,2)))

> CrossTable(taulabai,expected=TRUE)

 
   Cell Contents
|-------------------------|
|                       N |
|              Expected N |
| Chi-square contribution |
|           N / Row Total |
|           N / Col Total |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  303 

 
             |  
             |         A |         B | Row Total | 
-------------|-----------|-----------|-----------|
           A |        12 |       152 |       164 | 
             |    53.584 |   110.416 |           | 
             |    32.272 |    15.661 |           | 
             |     0.073 |     0.927 |     0.541 | 
             |     0.121 |     0.745 |           | 
             |     0.040 |     0.502 |           | 
-------------|-----------|-----------|-----------|
           B |        64 |        50 |       114 | 
             |    37.248 |    76.752 |           | 
             |    19.215 |     9.325 |           | 
             |     0.561 |     0.439 |     0.376 | 
             |     0.646 |     0.245 |           | 
             |     0.211 |     0.165 |           | 
-------------|-----------|-----------|-----------|
           C |        23 |         2 |        25 | 
             |     8.168 |    16.832 |           | 
             |    26.931 |    13.069 |           | 
             |     0.920 |     0.080 |     0.083 | 
             |     0.232 |     0.010 |           | 
             |     0.076 |     0.007 |           | 
-------------|-----------|-----------|-----------|
Column Total |        99 |       204 |       303 | 
             |     0.327 |     0.673 |           | 
-------------|-----------|-----------|-----------|

 
Statistics for All Table Factors


Pearson's Chi-squared test 
------------------------------------------------------------
Chi^2 =  116.472     d.f. =  2     p =  5.109944e-26