Estatistika deskribatzailea: ariketak/Aldagai kuantitatiboen arteko erlazio estatistikoa: korrelazioa eta erregresioa

Wikibooks(e)tik
Hona jauzi: nabigazioa, bilatu


3: Enpresa batean asteko ekoizpenari eta unitate kostuari buruzko datuak jaso dira aste zenbaitetan zehar:
Astea 1 2 3 4 5 6 7 8 9 10 11 12
Ekoizpena 10 12 15 18 22 27 33 39 42 48 56 68
Unitateko kostua 104 58 48 41 38 36 35 35 34 34 34 34

Kobariantza kalkulatu eta interpretatu.

Korrelazio-koefiziente lineala kalkulatu eta interpretatu.

Bi aldagaien artean nolako erlazio estatistikoa dago: lineala ala lerromakurra? Puntu hodeia marraztu galdera erantzuteko.

Astea Ekoizpena (x) Unitateko kostua (y) x*y
1 10 104 1040
2 11 58 696
3 12 48 720
4 15 41 738
5 18 38 836
6 22 36 972
7 27 35 1155
8 33 35 1365
9 39 34 1428
10 48 34 1632
11 56 34 1904
12 68 34 2312
baturak 390 531 14798

Kobariantza negatiboa denez, korrelazio negatiboa da, nahiz eta oso ahula izan daitekeen, korrelazioaren sendotasunari buruz kobariantzak ez baitu ezer adierazten.

Korrelazio-koefizientea kalkulatzeko bi aldagaien desbidazio estandarrak kalkulatu behar dira gainera:

x*x y*y
100 10816
144 3364
225 2304
324 1681
484 1444
729 1296
1089 1225
1521 1225
1764 1156
2304 1156
3136 1156
4624 1156
batura=16444 batura=27979

Beraz, korrelazio koefizientea hau da:

Korrelazio negatiboa dago (ekoizpena handitzean, unitateko kostua jaitsi egiten da, datuak mugitzen diren tartean behinik behin) eta ertain mailako sendotasunez gainera. Hala ere, puntu-hodeian korrelazioa sendoa dela ikus daiteke, kurba beherakor bati datuek estu jarraitzen baitiote. Kontraesanik ez dago, ordea: Pearson koefiezienteak korrelazio lineala neurtzen du, eta ez lerromakurra. Beraz, kontuz horrelako egoeretan: korrelazio lineala txikia izan daiteke, baina horrek ez du esan nahi korrelaziorik ez dagoenik, lerromakurra sendoa izan baitaiteke. Beraz, puntu-hodeiak beti arretaz aztertu beharra gomendatu behar da.

Puntuhodeia 0001.svg


5: Test bateko puntuazio totala eta galdera jakin bat ongi erantzun duten galdetu zaie ikasle zenbaiti:


Puntuazioa 87 46 65 72 82 61 39 42
Galdera b e b e e b b b

Galdera hori baztertzea komenigarria den azter ezazu.



Beraz, puntuazioa (x) gehitzean ongi erantzutetik gaizki erantzutera pasatzen da. Hau da, puntuazio altuena dutenek gaizki erantzuten dute. Ondorioz, alde horretatik ez da galdera ona.

Norabidea gorabehera, korrelazioaren sendotasunaren aldetik ere ez da galdera egokia testerako, korrelazio ahula denez, galderaren erantzunak ez baitu zerikusi handirik puntuazio totalarekin.


8: Administrazio publikoko oposizioetan lehiakideen artean, sexua (g: gizon, e:emakume), maila ekonomikoa (b: baxua, a:altua), lorturiko nota eta oposizioa prestatzeko bi urteko prestakuntza intentsiboa eskaintzen duen akademia batera (bai, ez) joan diren jaso dira:
Sexua g g g g e e e e
Maila a b a a a a b b
Nota 54 58 72 68 76 64 56 52
Akademia e e b b b b e e

Kalkulatu, R softwareaz lagunduta, aldagai guztien arteko korrelazio-koefiziente linealak eta hasiera batetik ezar daitezkeen hipotesien aurkakoak azaltzen saia zaitez, korrelazio partzialaren kontzeptua baliatuz.


> sexua=c(0,0,0,0,1,1,1,1)
> maila=c(1,0,1,1,1,1,0,0)
> nota=c(54,58,72,68,76,64,56,52)
> akad=c(0,0,1,1,1,1,0,0)
> datuak=data.frame(sexua,maila,nota,akad)
> cor(datuak,datuak)
            sexua      maila        nota      akad
sexua  1.00000000 -0.2581989 -0.06030227 0.0000000
maila -0.25819889  1.0000000  0.66950909 0.7745967
nota  -0.06030227  0.6695091  1.00000000 0.9045340
akad   0.00000000  0.7745967  0.90453403 1.0000000
  • Hipotesia: Maila ekonomikoaren eta notaren arteko korrelazioa ahula da.
  • Emaitza: rmaila ekonomikoa,nota=0.6695
  • Azalpena:


9: Estatistika-test bateko notak har itzazu Sareko helbide honetatik. Korrelazio-koefizienteak kalkulatuz, azter ezazu testeko nota handi bat lortzeko, galdera kopuru handi bat erantzun gabe uztea komenigarria den. Datuetatik zorizko lagin bat har ezazu prozedura efiziente batez.

Ikertzen diren elementu estatistikoak zerrendaturik daudenean, horietatik lagin bat erauzteko ohiko prozedura laginketa sistematikoa da. Horren arabera, zerrenda hasieratik zoriz aukeratutako elementu batetik abiatuta, aldiro beste elementu bat aukeratuko da, populazioa agortu arte. Ohiko prozedura da kontu ikuskaritza, non fakturak eta bestelako agiriak ordenaturik dauden. Kasu honetan horrelaxe egingo da.

> ongi=c(7,5,14,14,7,9,7,8,12,9,14)
> gaizki=c(5,10,0,1,4,6,3,7,1,5,0)
> hutsean=c(3,0,1,0,4,0,5,0,2,1,1)
> puntuak=c(0.45,0,1.4,1.35,0.5,0.6,0.55,0.45,1.15,0.65,1.4)
> datuak=data.frame(ongi,gaizki,hutsean,puntuak)
> cor(datuak,datuak)
              ongi     gaizki    hutsean    puntuak
ongi     1.0000000 -0.8542679 -0.3258441  0.9845322
gaizki  -0.8542679  1.0000000 -0.2131042 -0.9321309
hutsean -0.3258441 -0.2131042  1.0000000 -0.1551624
puntuak  0.9845322 -0.9321309 -0.1551624  1.0000000