Estatistika deskribatzailea: ariketak/Batezbestekoak eta beste zentro-neurriak

Wikibookstik

Ikus, gainera, Wikipedian Zentro-neurri eta Batezbesteko.



1 Donostian eta Baionan azken hilabetean zenbat film ikusi duten galdetu zaie pertsona batzuei. Emaitzak hauek dira:


Donostia: 4-2-0-0-1-1-1-4-4-6-3-3-2-4-4-5-5-4-2-2-5-6-3
Baiona: 0-1-3-3-5-4-4-3-3-3-2-2-2-1-1-0-0-1-3-3


Bi hirietako zinezaletasuna alderatzeko diagrama egokia era ezazu eta berau begiztatuz batezbestez oro har hiri bakoitzean ikusten den film kopuruak hurbildu itzazu. Hurbilketa hori batezbesteko aritmetiko sinplearen bitartez zehaztu itzazu.



Ebazpena:

Diagramak egiteko, maiztasun-taulak osatu behar dira lehenik:

Ikusitako filmak Donostiarrak Baionatarrak Donostiarrak (%) Baionatarrak (%)
0 2 3 %8.7 %15
1 3 4 %13 %20
2 4 3 %17.4 %15
3 3 7 %21.7 %35
4 6 2 %26.1 %10
5 3 1 %13 %5
6 2 0 %8.7 %0
23 20 100 100

Dagokion zutabe-grafikoa hau da:

Ikusten denez, donostiarren datuak 4 balioaren inguruan biltzen dira, beheruntz lerratuz: esan dezagun, gutxi gorabahera beraz, 3.5 dela batezbestekoa. Modu berean arrazoituz, baionatarren datuak 2.5 balioaren inguruan bildurik daudela esan genezake.

Bistaz hurbildutako balio hauek Batezbesteko aritmetiko sinplea erabiliz zehaztuko dira jarraian. Batezbestekoa datuen batura zati datu kopurua eginez kalkula daiteke zuzenean, baina erosoago egiteko maiztasun-taula bat garatuko da:

x (aldi kopurua) n(D) n(B) x·n(D) x·n(B)
0 2 3 0 0
1 3 4 3 4
2 4 3 8 6
3 3 7 9 21
4 6 2 24 8
5 3 1 15 5
6 2 0 12 0
23 20 71 44

R erabiliz, kalkulua egiteko ez da beharrezkoa datuak biltzea

>x=c(4,2,0,0,1,1,1,4,4,6,3,3,2,4,4,5,5,4,2,2,5,6,3)
>y=c(0,1,3,3,5,4,4,3,3,3,2,2,2,1,1,0,0,1,3,3)
>mean(x)
[1] 3.086957
>mean(y)
[1] 2.2

Beraz, donostiarrak orohar maizago joaten dira zinemara, hilabetean ia film bat gehiago ikusiz.


2 Denda batean langile batzuek egiten dute lana. Bere lan-txanda goiz zein arratsaldekoa izan daiteke, astegunetan zehar, arteartetik larunbatera. Honako taula honetan dendako salmentak agertzen dira langile, astegun eta goiz (g)/ arratsalde (a) txandaren arabera (eurotan):
Langilea/Eguna Asteartea Asteazkena Osteguna Ostirala Larunbata
Ane 184(g)/222(a) 234(g)/245(a) 212(g)/256(a) 321(g)/421(a) 475(g)/522(a)
Bea 132(g)/214(a) 242(g)/221(a) 202(g)/234(a) 331(g)/402(a) 406(g)/482(a)
Celia 202(g)/250(a) 263(g)/268(a) 243(g)/275(a) 365(g)/486(a) 467(g)/514(a)


  1. Zenbat gehiago saltzen da ostegunetik ostiralera batezbestez?
  2. Nolako aurresana egingo zenuke astearte bateko arratsalderako, saltzailea oraindik ezaguna ez bada?
  3. Zein egunetan kokatzen da Ane eguneko batez besteko salmeneten gainetik?



Ebazpena

1. Osteguneko batez besteko salmentak honela kalkulatzen dira:

Ostiraleko batez besteko salmenta, berriz, honela kalkulatzen da:

Ostiraletan, beraz, batezbestez 775.33-474=301.33 euro gehiago saltzen da.

2. Astearte arratsaldeko aurresan egoki bat astelehen arratsaldetako batez besteko salmenta da:

3. Ostegun eta ostiraleko batez besteko salmentak kalkulaturik daude. Astearte, asteazken eta larunbateko batez besteko salmentak kalkula ditzagun:

Emaitzak alderatzeko moduan jar ditzagun:

Langilea/Eguna Asteartea Asteazkena Osteguna Ostirala Larunbata
Ane 406 479 468 742 997
batezbestez 401.33 491 474 775.33 955.33

Ane astearte eta larunbatetan geratzen da batezbesteko salmenten gainetik.


3Urtebetetik beherako haurrek azken hilabetean osasun-zerbitzuetara zenbat aldiz joan diren jaso da:
Kontsulta kopurua Haur kopurua
0 8
1 12
2 16
3 11
4 8
5 3
6 5
7 -
8 1

Haur bakoitzeko batez besteko kontsulta-kopurua eta kontsulta kopuruen mediana kalkulatu behar dira.


Batezbestekoa kalkulatzeko datu guztien batura zati kopurua egin behar da. Datuen batura kalkulatzeko kontsulta balio bakoitza bider dagokion maiztasuna kalkulatu eta emaitza guztien batura kalkulatu behar da:


Aldagaia (x) Maiztasuna (n) n * x
0 8 0
1 12 12
2 16 32
3 11 33
4 8 32
5 3 15
6 5 30
7 0 0
8 1 8
baturak 64 162


Haur bakoitzeko batez besteko kontsulta kopurua hau da:




4Matxura batetik bestera makina bat zenbat denbora izan den funtzionatzen jaso da 100 alditan:
.
 92.51  89.04  74.64 103.30 100.40  66.35 119.40  99.85  72.58  51.98
105.60  62.32 111.40 128.20  63.68  95.40  84.50  86.04  43.94 125.60
115.50  99.19  58.11 146.20 122.40  53.82  55.21  67.84  50.98 133.50 
141.90  82.49 115.40  90.55  93.79 114.30 124.90 108.4 110.40  78.58
107.90 143.80 142.60 108.80 186.60  93.29  91.40 118.20  65.05 132.40
 87.29 114.50 120.40 113.00  93.77 112.40  94.01  97.55  92.21  96.32
 67.88  98.19  81.84  67.24  87.63  81.77  70.53 101.80  58.75 135.50
 96.57 100.90 112.20 102.10  50.27  94.64 139.40 133.30  32.45 138.00
131.20 119.00 142.30 141.50  78.47 115.80 129.40  76.90 114.70  51.80
 80.72  82.51  83.55  81.41 112.10  77.88 105.90  38.34  85.58 122.20


Batezbestez matxura batetik bestera zenbat denbora igarotzen den kalkulatu behar da zehaztasunez nahiz datuak tartetan bilduz.

Batezbestekoa zehaztasunez kalkulatzeko jatorrizko datuak gehitu eta datu kopuruaz zatitu behar da:

Kalkulua eskuz egiten bada erosoagoa da datuak tartetan bildu eta maiztasun-taulatik batezbestekoaren hurbilpena kalkulatzea. Horretarako datuak tartetan bildu behar dira lehendabizi:

> tarte=c(20,30,40,50,60,70,80,90,100,110,120,130,140,150,160,170,180,190,200)
> hist(x,breaks=tarte,plot=FALSE)
$breaks
[1]  20  30  40  50  60  70  80  90 100 110 120 130 140 150 160 170 180 190 200
$counts
[1]  0  2  1  8  7  7 13 16 10 15  7  7  6  0  0  0  1  0
Tartea Maiztasuna (n) Erdipuntua (x) n * x
30-40 2 35 70
40-50 1 45 45
50-60 8 55 440
60-70 7 65 455
70-80 7 75 525
80-90 13 85 1105
90-100 16 95 1520
100-110 10 105 1050
110-120 15 115 1725
120-130 7 125 875
130-140 7 135 945
140-150 6 145 870
150-160 0 155 0
160-170 0 165 0
170-180 0 175 0
180-190 1 185 185
Baturak 100 9810

Batezbestekoaren balioa hau da:

Balio hori ez dator bat jatorrizko datuekin kalkulatutakoarekin. Batezbesteko zehatza datu gordinak hartuz kalkulatzen dena da. Datuak tartetan bilduz kalkulatzen dena hurbilketa bat da. Beraz, ahal izanez gero, beti komeni da batezbestekoa jatorrizko datuekin kalkulatzea.



5 Webgune batek egunero izan duen bisita-kopurua jaso da hainbat egunetan zehar. Emaitzak taula honetan biltzen dira:
Bisitak Egunen portzentajea
0-100 %18
100-400 %24
400-1000 %36
1000-2000 %18
2000-5000 %4

Batez besteko bisita-kopurua kalkulatu behar da.

Maiztasun erlatiboak edukita ere kalkula daiteke batezbestekoa:



Datuak tartetan bilduta daudenez, tarte bakoitzeko erdipuntuarekin egin behar dira kalkuluak:



Batezbestez webguneak 731 bisita izaten ditu egunero.



6 Bezero batek erosi dizkigun azken 12 baterien batezbesteko iraupena 10 ordutik beherakoa bada, hornikuntza-kontratua eten egingo du. Hauek dira azken 12 baterien iraupenak (ordutan):
12.5 - 13.2 - 9.6 - 9.0 - 10.2 - 10.6 - 9.2 - 10.0 - 9.0 - 10.4 - 9.2 - 9.3

Betetzen al baldintza azken 12 bateriekin? Zenbatekoa izan behar da gutxienez bidaltzen zaizkion hurrengo bi baterien iraupena kontratua eten ez dadin?



Ebazpena: Azken 12 baterien batez besteko iraupena honela kalkulatzen da:



Azken 12 bateriekin kontratuak indarrean jarraitzen du, batesbestekoa 10etik gorakoa delako.

Azken 11 baterien iraupenen batura 109.7 da. Azken 12 baterien batezbestekoa 10 izateko, iraupenen batura 120 izan behar da. Azken 11 bateriekin batura 109.7 denez, baldintza betetzeko 12garren bateriaren iraupena 120-109.7=10.3 ordukoa izan behar da gutxienez.

Azken 10 baterien iraupenen batura, berriz, 96.5 da. Beraz, hurrengo bi baterien iraupenen batezbestekoa (120-96.5)/2=11.75 izan behar da.


7 Matematika azterketa batean izandako kalifikazioak jaso dira:


6.7 - 8.2 - 9.6 - 6.4 - 3.2 - 8.2 - 4.6 - 5.8 - 3.8 - 9.0 - 7.4 - 6.6 - 7.2 - 8.6 - 9.2 - 3.8 - 5.4 - 5.8 - 6.0


Kalifikazio horien mediana kalkulatu eta interpretatu behar da.



Ebazpena:


Mediana kalkulatzeko datuak txikienetik handienera ordenatu behar dira lehenik eta behin:


3.2 - 3.8 - 3.8 - 4.6 - 5.4 - 5.8 - 5.8 - 6.0 - 6.4 - 6.6 - 6.7 - 7.2 - 7.4 - 8.2 - 8.2 -8.6 - 9.0 - 9.2 - 9.6


Mediana erdian dagoen datua da. 19 datu daudenez, erdian dagoen datua 10. datua da. Beraz, mediana 6.6 da.


Honela interpretatzen da: ikasleen %50ek 6.6tik beherako kalifikazioa izaten dute; zentru-neurria ere badenez, oro har, ikasleek batezbestez 6.6 kalifikazioaren inguruan biltzen direla esan daiteke.



8 Toki batean ekaineko zenbait egunetako tenperatura maximoa jaso da (Celsius gradutan):


20.5 - 24.4 - 19.6 - 26.8 - 23.8 - 25.6 - 18.2 - 35.6 - 24.2 - 22.4
Muturreko datutzat jotzen dituzunak ezabatuz, batezbestekoa kalkulatu behar da.
Muturreko tenperaturen eraginik jasaten ez duen beste zentro-neurri bat zehaztu eta interpretatu behar da, aurrekoarekin alderatuz. Zein da egokiena?
Datu guztiak hartuz, batezbesteko aritmetiko sinplea aurreko neurriak baino handiagoa edo txikiagoa suertatuko al da? Zergatik?



Ebazpena:

Muturreko datutzat 35.6 tenperatura har daiteke. Hori kenduta, batezbestekoa 22.8 gradukoa suertatzen da. Beste batek 20 gradutik beherako tenperaturak ere muturreko datutzat jo zitzakeen eta orduan emaitza ezberdina izango zen. Hori dela eta, ez da zentro-neurri egokia, muturreko datuak hautemateko irizpide objektibo eta zehatz bat ezartzen ez den bitartean.

Muturreko datuen eraginik jasaten ez duen neurririk sinpleena mediana da. Mediana kalkulatzeko lehendabizi datuak ordenatu behar dira:


18.2 - 19.6 - 20.5 - 22.4 - 23.8 - 24.2 - 24.4 - 25.6 - 26.8 - 35.6


Datu kopurua bikoitia denez, ez dago garbi zein den erdiko datua. Oro har mediana kalkulatzeko metodo zenbait dago. Aukera guztietatik, erdiko bi datuak, 5. eta 6.a alegia, hartu eta horien batezbestekoa kalkulatuko dugu gure kasuan: bi datu horiek 23.8 eta 24.2 direnez, mediana (23.8+24.2)/2=24 gradukoa dela estimatuko da.

Beraz, ekaineko tenperatura maximoa, oro har, 24 graduko ingurukoa dela esan daiteke, bertatik behera datuen erdiak daudelako.

35.6ko muturreko datuak batezbestekoa gora ekarriko duela aurreikus daiteke. Datu guztiak hartuta, batezbesteko aritmetiko sinplea 24.1 ateratzen da. Ikus daitekeenez, azkenean muturreko datuak ez du hain eragin handirik izan, baina oro har muturreko datuak daudenean neurririk egokiena mediana dela esan daiteke.



9 Lanpostu baterako hautagai bien artean aukeratu behar da. Bakoitzak hiru froga mota burutu ditu: euskara froga, froga orokorra eta froga espezifikoa. Lortu dituzten kalifikazioak hauek dira:
A hautagaia: 86 (eusk), 67 (orok), 74 (esp)
B hautagaia: 76 (eusk), 72 (orok), 76 (esp)

Frogei emandako haztapenak 4, 2 eta 8 izanik, hurrenik hurren, kalkulatu hautagai bakoitzaren batez besteko kalifikazioa.

Batezbesteko haztatua kalkulatu behar da hautagai bakoitzeko:





10 18-30 urte bitarteko pertsonen multzoan azken urtean gutxienez behin larrialdi-zerbitzuetara joan direnen portzentajea %14 da, %26 30-60 urte bitartean eta %42 60 urtetik gorakoetan. Adin-tarte horietan biztanleriaren %25, %45 eta %30 badago, zenbatekoa da larrialdi-zerbitzuetara jo duten pertsonen batez besteko portzentajea?


Ebazpena: Batez besteko portzentajeak kalkulatzeko formula egokiena batezbesteko haztatuarena da, portzentajea gertatzen den totalaren arabera haztatu behar baitira datuak (ez baitira berdinak %10 40 pertsonako multzo batean eta %10 100 pertsonako multzo batean). Eskatutako batez besteko portzentajea honela kalkulatzen da:




11 40 cd-ko argi-intentsitatea duen argi-iturri batekin bi fotometro frogatu dira. Une ezberdinetan eman zituzten neurketak hauek dira:
A: 38-43-42-41-40
B: 38-39-40-42-39

Zein da batezbestez errore txikiena egiten duen fotometroa?



Ebazpena:


Batezbesteko koadratikoak kalkulatu behar dira batezbesteko errorea kalkulatzeko:



40 cd-ko benetako baliorako errore txikiena duen fotometroa B da.



12 Ondoz ondoko 6 urtetan zehar, enpresa bateko salmenten bilakaera agertzen da jarraian:
36-44-57-65-67-85

Salmenten urteko batezbesteko hazkunde erlatiboa kalkulatu behar da.


Urtez urteko hazkunde erlatiboak honela kalkulatzen dira:



Batezbesteko geometrikoa honela kalkulatzen da:



6 urteko hazkunde osotik ere kalkula daiteke. kapitalizazio konposatuaren legea oinarritzat, kapitalaren ordez salmentak eta interes-tasaren ordez h hazkunde-tasa hartuz:

5 urtetan zehar hazkunde totala %136 (2.36-1) izan da eta urtez urteko batezbesteko hazkundea %18.


13 Orduko 600 piezako errendimendua duten 4 makinekin aritzen da lanean lantegi batean, egunean 8 orduz. 1000 piezako errendimendua duten beste 2 makina ere badaude, baina mantenu-arrazoiengatik horiekin 6 orduz soilik izan daiteke lanean. Zein da orduko batez besteko errendimendua egun arrunt batean zehar?

Errendimenduen batezbestekoa kalkulatzeko batezbesteko harmonikoa erabili behar da. Formula erabili ordez, egindako ekoizpena zati ordu kopurua eginez ere kalkula daiteke.

ekoizpen totala=600 x 4 x 8 + 1000 x 2 x 6 = 19200 + 12000 = 31200
ordu kopurua= 4 x 8 + 2 x 6 = 44

Orduko batez besteko errendimendua 31200 / 44 = 709.1 piezakoa da.

Batezbesteko harmonikoaren formula bera erabiliz ere egin daiteke kalkulua, pieza bakoitza burutu deneko errendimendu-tasa datutzat hartuz:




14 Honako taula honetan, banku-kontu batean hilabete batean zehar izandako mugimenduak eta saldoak azaltzen dira:


Data Mugimendua Saldoa
2011-10-1 - 1200
2011-10-5 -200 1000
2011-10-14 +500 1500
2011-10-22 -800 700
2011-10-28 -200 500
2011-10-31 - 500

Hileko batez besteko saldoa kalkulatu behar da.

Saldoari buruzko datuak kontuan izan duten iraupenaren arabera haztatu behar dira. Beraz:



15: Argindar-enpresa batek bi herrietako abonatuen gastua jaso du azken hi-

labetean. Datuak hauek dira:

Kontsumoa (kw) Irun Hernani
0-10 120 145
10-20 432 356
20-40 756 605
40-60 321 418
60-100 81 215
100-200 12 41

Bi herrietan hileko familiako batez besteko kontsumoa alderatu behar da, horretarako zentro-neurri egokiena baliatuz.


Medianaren kalkulua Irungo datuetarako. Irudia R softwarearekin osatu da. Kodea ikusteko, egin klik irudian. Parametroak aldatuz, beste interpolazioak irudikatzeko txantiloi edo plantilla moduan erabil daiteke.



16: Zoriz aukeratutako 70 urteko hainbat pertsonari lanbidea eta pairatu dituzten bihotzeko krisien kopurua galdetu zaie. Emaitzak taula honetan bildu dira:
Lanbidea/Krisi kopurua 0 1 2 3
Irakasleak 4 2 0 1
Baserritarrak 3 1 0 0
Teknikoak 2 1 1 0
Langile berezituak 6 3 2 1
Langile arruntak 8 3 0 2
Osasun-arloko langileak 4 1 2 1
Gidariak 3 4 2 1
Guztira 30 15 7 6

Lanbide bakoitzean batez besteko krisi kopurua kalkulatu eta batezbesteko orokorrarekin alderatu behar da, horretarako diagrama egokia eratuz. Talde bakoitzeko batezbestekoak soilik ezagututa, nola kalkulatu beharko litzateke batezbesteko orokorra?

R kodea ikusteko, sakatu irudian.