Estatistika deskribatzailea: ariketak/Aldagai kuantitatiboen arteko erlazio estatistikoa: korrelazioa eta erregresioa

Wikibooks(e)tik
Hona jo: nabigazioa, bilatu
1: Ikasle zenbaiten gainean, matematika nota, bigarren hizkuntzako nota, 200 m korritzeko behar duten denbora (segundutan) eta egunean zehar telefono mugikorrarekin zenbat denbora ibili diren (minututan):
Matematika: 5.2,5.2,8.3,8.9,4.3,7.4,7.8,9.0,5.6
Hizkuntza: 3.4,5.4,7.8,9.2,2.1,6.8,8.3,8.7,4.5
Lasterketa: 36,77,58,42,91,74,24,35,56
Telefonoa:45,54,12,15,66,28,22,10,39

Matematika notaren eta beste hiru aldagaien arteko puntu hodeiak marraztu eta interpretatu behar dira


2: 2010 urteko kontabilitatea harturik, enpresa zenbaitetan I+G alorrean izandako gastu eta mozkin totalen portzentajea kalkulatu da fakturazioarekiko. Datuak hauek dira:


I+G 2 3 1 4 6
Mozkinak 15 20 12 24 22

Bi aldagaien arteko kobariantza kalkulatu eta interpretatu.

Bi aldagaien arteko korrelazio-koefiziente lineala kalkulatu eta interpretatu. Esan al daiteke ziurtasun handiz I+G gastuak mozkinak gehitzen dituela?



3: Enpresa batean asteko ekoizpenari eta unitate kostuari buruzko datuak jaso dira aste zenbaitetan zehar:
Astea 1 2 3 4 5 6 7 8 9 10 11 12
Ekoizpena 10 12 15 18 22 27 33 39 42 48 56 68
Unitateko kostua 104 58 48 41 38 36 35 35 34 34 34 34

Kobariantza kalkulatu eta interpretatu.

Korrelazio-koefiziente lineala kalkulatu eta interpretatu.

Bi aldagaien artean nolako erlazio estatistikoa dago: lineala ala lerromakurra? Puntu hodeia marraztu galdera erantzuteko.

Astea Ekoizpena (x) Unitateko kostua (y) x*y
1 10 104 1040
2 11 58 696
3 12 48 720
4 15 41 738
5 18 38 836
6 22 36 972
7 27 35 1155
8 33 35 1365
9 39 34 1428
10 48 34 1632
11 56 34 1904
12 68 34 2312
baturak 390 531 14798

Kobariantza negatiboa denez, korrelazio negatiboa da, nahiz eta oso ahula izan daitekeen, korrelazioaren sendotasunari buruz kobariantzak ez baitu ezer adierazten.

Korrelazio-koefizientea kalkulatzeko bi aldagaien desbidazio estandarrak kalkulatu behar dira gainera:

x*x y*y
100 10816
144 3364
225 2304
324 1681
484 1444
729 1296
1089 1225
1521 1225
1764 1156
2304 1156
3136 1156
4624 1156
batura=16444 batura=27979

Beraz, korrelazio koefizientea hau da:

Korrelazio negatiboa dago (ekoizpena handitzean, unitateko kostua jaitsi egiten da, datuak mugitzen diren tartean behinik behin) eta ertain mailako sendotasunez gainera. Hala ere, puntu-hodeian korrelazioa sendoa dela ikus daiteke, kurba beherakor bati datuek estu jarraitzen baitiote. Kontraesanik ez dago, ordea: Pearson koefiezienteak korrelazio lineala neurtzen du, eta ez lerromakurra. Beraz, kontuz horrelako egoeretan: korrelazio lineala txikia izan daiteke, baina horrek ez du esan nahi korrelaziorik ez dagoenik, lerromakurra sendoa izan baitaiteke. Beraz, puntu-hodeiak beti arretaz aztertu beharra gomendatu behar da.

Puntuhodeia 0001.svg
4: Ikasle zenbaiten sexua kontuan harturik, froga batean izandako kalifikazioak jaso dira:


Sexua g e g e g e e
Kalifikazioa 6.7 8.5 6.9 7.2 8.0 8.6 9.2

Korrelazio koefiziente lineala kalkulatu eta interpretatu. Zenbateraino du eragina sexuak kalifikazioetan?



5: Test bateko puntuazio totala eta galdera jakin bat ongi erantzun duten galdetu zaie ikasle zenbaiti:


Puntuazioa 87 46 65 72 82 61 39 42
Galdera b e b e e b b b

Galdera hori baztertzea komenigarria den azter ezazu.



Beraz, puntuazioa (x) gehitzean ongi erantzutetik gaizki erantzutera pasatzen da. Hau da, puntuazio altuena dutenek gaizki erantzuten dute. Ondorioz, alde horretatik ez da galdera ona.

Norabidea gorabehera, korrelazioaren sendotasunaren aldetik ere ez da galdera egokia testerako, korrelazio ahula denez, galderaren erantzunak ez baitu zerikusi handirik puntuazio totalarekin.


6: Botika berri bat asmatu ondoren, urtebetez frogatu zen gaixotasun bat pairatzen zuten pertsonen zenbaiten artean. Beste batzuek ohiko tratamenduarekin jarraitu zuten. Urtebete pasa ondoren, gaixotasun-egoera arindu den jaso zen. Emaitzak honako hauek dira:


Botika berria? b b b b b e e e e e
Gaixotasuna arindu? b e b b b e e e e b

Bi aldagaien arteko korrelazio koefiziente lineala baliatuz, erabaki botika eraginkorra izan daitekeen.



7: Test bat gainditu duten ala ez eta testeko galdera jakin bat ongi erantzun duten ala ez jaso da azterketa bat egin duten pertsona zenbaiten artean. Emaitzak hauek dira:


Testa gainditu? / Galdera ongi? bai ez
bai 36 16
ez 12 54

Bi aldagaien arteko korrelazio koefiziente lineala baliatuz, azter ezazu galderaren garrantzia testaren kalifikazioa zehazterakoan.


8: Administrazio publikoko oposizioetan lehiakideen artean, sexua (g: gizon, e:emakume), maila ekonomikoa (b: baxua, a:altua), lorturiko nota eta oposizioa prestatzeko bi urteko prestakuntza intentsiboa eskaintzen duen akademia batera (bai, ez) joan diren jaso dira:
Sexua g g g g e e e e
Maila a b a a a a b b
Nota 54 58 72 68 76 64 56 52
Akademia e e b b b b e e

Kalkulatu, R softwareaz lagunduta, aldagai guztien arteko korrelazio-koefiziente linealak eta hasiera batetik ezar daitezkeen hipotesien aurkakoak azaltzen saia zaitez, korrelazio partzialaren kontzeptua baliatuz.


> sexua=c(0,0,0,0,1,1,1,1)
> maila=c(1,0,1,1,1,1,0,0)
> nota=c(54,58,72,68,76,64,56,52)
> akad=c(0,0,1,1,1,1,0,0)
> datuak=data.frame(sexua,maila,nota,akad)
> cor(datuak,datuak)
            sexua      maila        nota      akad
sexua  1.00000000 -0.2581989 -0.06030227 0.0000000
maila -0.25819889  1.0000000  0.66950909 0.7745967
nota  -0.06030227  0.6695091  1.00000000 0.9045340
akad   0.00000000  0.7745967  0.90453403 1.0000000
  • Hipotesia: Maila ekonomikoaren eta notaren arteko korrelazioa ahula da.
  • Emaitza: rmaila ekonomikoa,nota=0.6695
  • Azalpena:


9: Estatistika-test bateko notak har itzazu Sareko helbide honetatik. Korrelazio-koefizienteak kalkulatuz, azter ezazu testeko nota handi bat lortzeko, galdera kopuru handi bat erantzun gabe uztea komenigarria den. Datuetatik zorizko lagin bat har ezazu prozedura efiziente batez.

Ikertzen diren elementu estatistikoak zerrendaturik daudenean, horietatik lagin bat erauzteko ohiko prozedura laginketa sistematikoa da. Horren arabera, zerrenda hasieratik zoriz aukeratutako elementu batetik abiatuta, aldiro beste elementu bat aukeratuko da, populazioa agortu arte. Ohiko prozedura da kontu ikuskaritza, non fakturak eta bestelako agiriak ordenaturik dauden. Kasu honetan horrelaxe egingo da.

> ongi=c(7,5,14,14,7,9,7,8,12,9,14)
> gaizki=c(5,10,0,1,4,6,3,7,1,5,0)
> hutsean=c(3,0,1,0,4,0,5,0,2,1,1)
> puntuak=c(0.45,0,1.4,1.35,0.5,0.6,0.55,0.45,1.15,0.65,1.4)
> datuak=data.frame(ongi,gaizki,hutsean,puntuak)
> cor(datuak,datuak)
              ongi     gaizki    hutsean    puntuak
ongi     1.0000000 -0.8542679 -0.3258441  0.9845322
gaizki  -0.8542679  1.0000000 -0.2131042 -0.9321309
hutsean -0.3258441 -0.2131042  1.0000000 -0.1551624
puntuak  0.9845322 -0.9321309 -0.1551624  1.0000000

Erregresioa[aldatu]


10: Ikasle batzuen asteko ikasketa-orduak eta matematikan izandako nota jaso da. Honako hauek dira datuak:
Ikasketa-orduak 2 3 4 6 8
Matematika-nota 3.2 4.6 6 5.8 8.4

Karratu txikienen erregresio zuzenaren parametroak zenbatetsi eta aurresanak eta erroreak kalkulatu behar dira.





11: Abuztuko egun batzuetan izozki denda batek izozki salmentak (eurotan) eta tenperatura maximoa jaso zuen. Datuak hauek dira:
Eguna 1 2 3 4 5 6 7 8
Salmentak 124 145 202 196 154 176 188 167
Tenperatura 25 29 42 39 28 37 38 33
  1. Karratu txikienen erregresio zuzena zehaztu behar da.
  2. Puntu hodeia eta erregresio zuzena grafiko berean irudika itzazu.
  3. Biharko 35 graduko tenperatura maximoa iragarri du eguraldi-pronostikoak. Izozki-salmentaren aurresana egin behar da. Zenbateraino da fidagarria aurresana?
  4. Erroreen diagrama eratu eta interpretatu behar da.

Doikuntza ez linealak[aldatu]

Kurba sorta 001.png

Aurreko kurbak doitzeko prozedura orokorra, v eta w aldagaiak aldatuz, kurba linealizatu edo zuzen bihurtzea da. v eta w aldatuak erregresio-zuzeneko x eta y izango dira eta ohiko formulak kalkulatzea besterik ez da beharko, a eta b kalkulatu eta hortik, aldaketak deseginez, kurbaren parametroak zehazteko.

Lerroa Linealizazioa () a b


12: Lantegi batean esperimentu bat egin da eguneko mantenimendu orduak aldatuz eguneko ekoizpena jasotzeko. Datuak hauek dira:
Eguna 1 2 3 4 5 6
Mantenimendu orduak 2 3 4.5 6 7 8
Ekoizpena 4 6 9 11 11.5 11.8
  1. Erregresio-zuzena eman eta dagokion mugatze-koefizientea kalkulatu. Lerro egokia al da?
  2. Puntu hodeia irudikatu eta aukeratu datuetara doien izan daitezkeen lerro motak.
  3. erako kurba egokitu datuei eta adierazi zein den mantenimendu orduen araberako ekoizpen maximoa. Mugatze-koefizientea ere kalkulatu.
  4. erako kurba egokitu datuei eta aztertu aurreko kurba baino doiagoa den.

(2)

> v=c(2,3,4.5,6,7,8)
> w=c(4,6,9,11,11.5,11.8)
> x=1/v
> y=w
> lm(y~x)
Coefficients:
(Intercept)            x  
      14.33       -21.93


(3)

> v=c(2,3,4.5,6,7,8)
> w=c(4,6,9,11,11.5,11.8)
> x=log(v)
> y=log(w)
> lm(y~x)
Coefficients:
(Intercept)            x  
     0.8909       0.8052


13: Esperimentu batzuk egin ondoren, mekanismo batek barruko tenperatura zenbaitetarako gelditzeko duen probabilitateak jaso dira:
Tenperatura 38 46 54 68 80
Gelditzeko probabilitatea 0.12 0.24 0.38 0.58 0.94
  1. erako kurba egokitu datuei.
  2. Gelditzeko probabilitatea 0.5 baino txikiagoa izateko, zein izan behar da tenperatura maximoa?
  3. Zein tenperaturako esan daiteke ziurtzat jotzen dela geldialdia?
  4. Zenbateraino da doikuntza egokia?

Logit eredua[aldatu]

14: Laborategiko animalia zenbaiti farmako esperimental baten dosi ezberdinak eman zaizkie eta dosi bakoitzeko hobekuntza izan zutenen portzentajea jaso da:
Dosia (mg) 4 6 8 12
Hobekuntza-portzentajea  %22  %43  %69  %82
  1. 10 mgko dosi batekin, hobetzen den portzentajeari buruzko aurresan bat egin behar da, logit eredua erabiliz.
  2. Hobekuntza-portzentajea %99 izateko, zenbateko dosia eman behar da?
  3. Doikuntzaren egokitasuna neurtu behar da mugatze-koefizientea erabiliz.


15: Gidatzeko baimena eskuratzeko azterketan, ikasleek zenbat trebakuntza ordu izan zituzten eta azterketa gainditu zen jaso ziren. Logit eredua erabiliz, aurresan ezazu zenbat ordu behar diren azterketa %99ko probabilitateaz gainditzeko. Datuak:
Trebakuntza orduak Gainditu? (b:bai/e:ez)
4 e-b-e-e-e-e-e-e-e-e
5 e-e-b-e-e-b-b-e-e-e
8 e-e-b-b-e-b-e-b-b-e
10 b-b-b-b-b-b-e-e-e-e
14 e-b-b-b-b-b-b-b-b-b



16: Landare bateko fruituak toxikoak izan arte ongarri bat eman zaie saiakunta batean, ongarri dosi bakoitzeko fruitu jangarriak eta ez toxikoak ematen dituzten landareen portzentajea jasoz:
Dosia (mg) 4 6 8 12
Jangarrien portzentajea  %90  %67  %54  %12

Fruitu jangarria izateko probabilitatea %80 izatea nahi bada gutxienez, kalkulatu horretarako ongarri-dosi maximoa, logit eredua erabiliz. Mugatze-koefizientea kalkulatu, erroreen bariantzaren bitartez.