1- Tablas Tablas de frecuencias con datos agrupados
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos. • Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando la cantidad de datos cuo valor está entre los e!tremos del intervalo. "uego se calculan las frecuencias relativas acumuladas, si es pertinente. intervalos, se pueden determinar • Si no se conocen los intervalos, determinar de la siguiente siguiente manera# (recuerda $ue los intervalos intervalos de clase se se emplean emplean si las variables variables toman toman un n%mero n%mero grande de valores valores o la variable variable es continua&.
' e busca busca el valor valor má!imo má!imo de la variabl variablee el valor valor mínimo. mínimo. Con estos estos datos se determ determina ina el rango. ' e divide el rango en la cantidad de intervalos $ue se desea tener,(por lo general se determinan ) intervalos de lo contrario es ideal $ue sea un n%mero impar impar por ejemplo ), *, +& obtenindose así la amplitud o tama-o tama-o de cada intervalo. ' Comenzando por el mínimo valor de la variable, $ue será el e!tremo inferior del primer intervalo, se suma a este valor la amplitud para obtener el e!tremo e!tremo superior así sucesivamente. • tra forma de calcular la cantidad de intervalos es aplicando los siguientes mtodos# Método Sturges# / 0 1 2 3,334 log n
donde# /0 n%mero de clases n0 tama-o muestral 5ebemos tener en cuenta 4 cosas. Primero $ue el n%mero de intervalos me tiene $ue dar impar, segundo $ue el resultado resultado se redonda generalment generalmentee a la baja. i al redondear redondear a la baja nos da como resultado un n%mero par debemos redondear al alza. 6ste es el mtodo $ue tiene maor precisión. Método Empírico: este mtodo depende del criterio del evaluador de los datos, por lo tanto es arbitrario. 5ice lo siguiente.
)≥/
≥
47
Veamos Veamos como se resuelve el siguiente eercicio del libro Santillana !:
6n un centro comercial, se consultó la edad a todas las personas $ue entraban entre las 14#77 h 14#37 h. "os resultados obtenidos fueron los siguientes#
' "onstru#e una tabla de frecuencias cu#os datos estén agrupados en oc$o intervalos. 18Para poder construir la tabla de frecuencias lo primero $ue debemos hacer es calcular el rango. El rango da la idea de pro!imidad de los datos a la media. e calcula restando el dato menor al dato ma#or.
6l dato maor el menor lo hemos destacado con color rojo# 5ato maor ' dato menor 0 %& - 1 0 *4 Por lo tanto9 'ango ( %
48 6n el problema nos dicen $ue debemos agruparlo en : intervalos o clases, con este dato podemos calcular la amplitud o tama-o de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos $ue se desean obtener (en este caso son :&.
72 / 8 = 9 Por lo tanto la amplitud de cada intervalo será de 9 3° Ahora podemos comenzar a construir la tabla de frecuencias:
;a distintas formas de construir los intervalos dependiendo del tipo de variable $ue estemos trabajando. a) Variables cuantitativas discretas# solo pueden tomar un n%mero finito de valores. iendo por lo general estos valores los n%meros naturales 1, 4, 3...
categorizamos variables discretas los límites de clase son idnticos a los límites reales.Por ejemplo, el n%mero de personas $ue viven en una familia podemos agruparlo, 5e 1 hasta 4 (7 es imposible no ha ninguna familia sin ning%n miembro& 5e 3 hasta =, 5e ) hasta *. b) Variables cuantitativas continuas# "as variables continuas, por el contrario, pueden, tomar un n%mero infinito de valores en cual$uier intervalo dado.6n este caso los valores se agrupan en intervalos cuos límites inferior superior serían los siguientes#
>nferior # "ii uperior# "si'1 ;abitualmente, los intervalos se consideran cerrados a la iz$uierda abiertos a la derecha, es decir $ue el e!tremo inferior está incluido en el intervalo, pero el e!tremos superior no. 6s importante mencionar $ue las clases o intervalos para las variables continuas pueden ser de tres tipos# abiertas# clases abiertas tienen límites determinados (a,b&, pero los valores $ue la contienen comprenden valores mu cercanos a estos limites sin comprenderlos a ellos mismos, esto se representa con un intervalo definido entre parntesis (&. 6sto $uiere decir $ue esta clase contiene valores desde a hasta b pero no contiene e!actamente a ni b solo valores mu cercanos. cerradas# las clases cerradas, además de los valores $ue están entre a b, los contiene a ellos, se representa con corchetes ?a,b@. semiabiertas: pueden contener a o b más los valores $ue están entre ellos, se puede representar con un corchete un parntesis, por ejemplo, (a,b@, en este caso no contiene el valor a si los valores de b, adem*s de los valores +ue est*n entre estos
") 'egistro discreto de variables continuas: Cuando la variable considerada es continua pero ocurre $ue la precisión del instrumento de medida se limita a un n%mero finito de datos, e!iste la opción de construir los intervalos de tal forma $ ue ambos e!tremos estn incluidos en l.
6j )7 a )4, )3 a )), )A a ):, )+ al A1 A4 al A= 6stos serían los límites aparentes de los intervalos. Con esta información construiremos la tabla en esta oca sión con el %ltimo mtodo e!plicado.
Besponder las siguientes preguntas# a& 5el total de personas encuestadas, cuántas personas tienen entre 31 =7 a-osD 'espuesta: bservamos los datos obtenidos en la tabla tenemos $ue#
6l dato lo obtenemos de la columna de la frecuencia absoluta. Becuerda $ue# recuencia absoluta Corresponde a la cantidad de veces $ue se repite un dato. 5enotamos este valor por f i.
Por lo tanto la respuesta es . personas.
b& 5el total de personas encuestadas, cuántas personas tienen A7 o menos a-osD 'espuesta: bservamos los datos obtenidos en la tabla tenemos $ue#
6l dato lo obtenemos de la columna de frecuencia absoluta acumulada.
Becuerda $ue# recuencia absoluta acumulada es la suma de las frecuencias absolutas observadas hasta el intervalo i. 6n este caso es el intervalo A. Por lo tanto la respuesta es 3A personas tienen A7 o menos a-os. c& Cuál es la probabilidad de, $ue al elegir al azar a un persona consultada, esta tenga entre 11 47 a-osD 'espuesta: bservamos los datos obtenidos en la tabla tenemos $ue#
6l dato lo obtenemos de la columna de frecuencia relativa. Becuerda $ue# recuencia relativa Corresponde a la probabilidad de pertenecer a cierta categoría. e puede e!presar en tantos por ciento.
6n este caso es el intervalo 4, a $ue es ahí donde se encuentran las edades entre 11 47 a-os. Entonces la respuesta es: /a probabilidad es 10
Por %ltimo vamos a repasar el concepto de# recuencia relativa acumulada 23i), 6s la probabilidad de observar un valor menor o igual al valor $ue toma la variable en estudio en ese intervalo.
e calcula dividiendo Ei por el n%mero total de datos. Fambin puedes calcularlo umando la frecuencia relativa de cada grupo con la frecuencia relativa acumulada del grupo anterior. i haces correctamente estos cálculos, el %ltimo grupo tendrá una frecuencia acumulada de 1, o mu cerca de 1, permitiendo redondear el error. Becuerda $ue este valor se puede e!presar como porcentaje, para esto solo debes multiplicar el valor obtenido por 177 listoGGG 6ste cálculo te sirve en el caso de $ue te pregunten# d& i le preguntas a una persona cual$uiera Cuál es la probabilidad de $ue tenga )7 a-os o menosD
'espuesta: "a probabilidad es de un *AH
") T'4T4M5E6T7 84'4 94T7S 4';8497S "uando la muestra consta de &< o m*s datos, lo aconseable es agrupar los datos en clases # a partir de estas determinar las características de la muestra # por consiguiente las de la poblaci=n de donde fue tomada 4ntes de pasar a definir cu*l es la manera de determinar las características de interés 2media, mediana, moda, etc) cuando se $an agrupado en clases los datos de la muestra, es necesario +ue sepamos como se agrupan los datos 8asos para agrupar datos a 9eterminar el rango o recorrido de los datos 'ango ( Valor ma#or > Valor menor b Establecer el n?mero de clases 2@)en +ue se van a agrupar los datos tomando como base para esto la siguiente tabla
Fama-o de muestra o Io. 5e datos Jenos de )7 )7 a ++ 177 a 4)7 4)7 en adelante
I%mero de clases )a* A a 17 * a 14 17 a 47
El uso de esta tabla es uno de los criterios +ue se puede tomar en cuenta para establecer el n?mero de clases en las +ue se van a agrupar los datos, eAisten otros para $acerlo 9eterminar la amplitud de clase para agrupar 2")
d ormar clases # agrupar datos 8ara formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor +ue el dato menor encontrado en la muestra # posteriormente se suma a este valor ", obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente # así sucesivamente Eemplo: /os siguientes datos se refieren al di*metro en pulgadas de un engrane
A.*) A.)7 *.4) *.77 *.4)
*.77 A.)7 A.*7 A.*7 A.*)
*.77 A.)7 A.77 A.)7 A.4)
A.*) A.4) A.*) A.*) A.4)
A.)7 A.4) A.77 A.4) *.77
A.)7 A.)7 A.*) A.A) A.*)
*.1) A.A) A.*) A.*) *.77
*.77 *.77 *.17 *.17 *.1)
a) 4grupe datos, considere @(. b) 7btenga: 3istograma, polígono de frecuencias, oiva # distribuci=n de probabilidad c) 7btenga: media, mediana, moda # desviaci=n est*ndar Soluci=n: a) 4grupando datosB 1
'( VM - Vm ( %C > .<< ( 1C
@(.
& 0ormando clases 8ara formar la primera clase se toma un valor un poco menor +ue el valor menor encontrado en la muestraB luego,
">
" Erecuencia
).+* K A.1: A.1+ K A.=7 A.=1 K A.A4 A.A3 K A.:= A.:) K *.7A *.7* K *.4: Fotal
4 ) * 13 * A =7
a) Media 2 )
Jarca clase A.7*) A.4+) A.)1) A.*3) A.+)) *.1*)
de "ímite real "ímite real Erecuencia inferior superior relativa ).+A) A.1:) A.=7) A.A4) A.:=) *.7A)
A.1:) A.=7) A.A4) A.:=) *.7A) *.4:)
Erecuencia Belativa acumulada 4L=7 0 7.7) 7.7) )L=707.14) 7.1*) 7.1*) 7.3)7 7.34) 7.A*) 7.1*) 7.:)7 7.1) 1.777 1.777
( 9onde: @ ( n?mero de clases Ai ( marca de clase i f i ( frecuencia de la clase i
n(
n?mero de datos en la muestra
b) Mediana 2Dmed)
9onde: /i ( límite real inferior de la clase +ue contiene a la mediana me-1 ( sumatoria de las frecuencias anteriores a la clase en donde se encuentra la mediana f me ( frecuencia de la clase en donde se encuentra la mediana 4 ( amplitud real de la clase en donde se encuentra la mediana 4 ( /'S-/'5 /'S ( límite real superior de la clase +ue contiene a la mediana /'5 ( límite real inferior de la clase +ue contiene a la mediana 6 ( n?mero de datos en la muestra f) Moda 2Dmod)
9onde: /i ( límite real inferior de la clase +ue contiene a la moda d1 (
(
d (
(
fmo ( frecuencia de la clase +ue contiene a la moda fmo-1( frecuencia de la clase anterior a la +ue contiene a la moda fmo1( frecuencia de la clase posterior a la +ue contiene a la moda 4 ( amplitud real de la clase +ue contiene a la moda 4 ( /'S > /'5 /'S ( límite real superior de la clase +ue contiene a la moda /'5 ( límite real inferior de la clase +ue contiene a la moda g) 9esviaci=n est*ndar 2S)
( 9onde: Ai ( marca de clase i
( media aritmética f i ( frecuencia de la clase i
( n?mero total de datos en la muestra