PROYECTO FINAL ALUmno ASIGNATURA ESTADISTICA INSTITUTO IACC DE DICIEMBRE DEL
INTRODUCCIÓN El término estadística proviene de la palabra Estado y se refiere al origen histórico de esta disciplina, relacionada con la descripción cuantitativa de asuntos del Estado. También se llamó aritmética política. Según definición de William Petty a finales del 1600, su objetivo inicial era describir cuantitativamente diversos hechos de interés. En tiempos de Julio César (100 a. C.), Augusto el estadístico era el recaudador de impuestos y en tiempos de Guillermo el Conquistador (1070 aproximadamente) se editó el primer registro o censo de Inglaterra (Libro Domesday, 1086). En el siglo XVII, John Graunt (1620-1674) y W. Petty (1623-1687) desarrollaron la estadística vital. Después de una reseña histórica de la estadística podemos apreciar con el paso de estas nueve semanas de estudio que la estadística es primordial para el diario vivir en cada ejercicio aplicado de las semanas estudiadas partiendo por la estadística descriptiva, Medidas de tendencia central y de posición, Medidas de dispersión, Medidas de distribución, Estadística bivariada, Regresión lineal, Teoría de las probabilidades y terminando por Modelos de probabilidad con estas herramientas estamos listos para los nuevos desafíos que se pongan por delante para realizar asesorías de un alto nivel como profesionales.
DESARROLLO
1) Utilizando la variable “Tipo de licencia”, se pide:
a) Identifique la población.
La población a estudiar constituye a las personas conductoras de la región metropolitana
b) Clasifique la variable en estudio.
Debido al estudio que están realizando la variable considerada es el tiempo de reacción que tienen estos conductores, que corresponde a una variable cuantitativa continua
c) Construya un gráfico circular para la variable “Tipo de Licencia”.
Considere la tabla adjunta en la hoja de desarrolla. N° de conductores . n=180
A1 16%
A2 21%
B 63%
A1
A2
B
2) Considerando el histograma que se presenta a continuación: a) Realice la interpretación del histograma. Para la interpretación del histograma considere los siguientes cuatro aspectos: la forma de la distribución (coeficiente de asimetría), el rango de la distribución, la mayor y menor frecuencia.
El coeficiente de asimetría corresponde a -0.113, por lo tanto debido a la cercanía que tiene con el 0 , se podría clasificar como una distribución de datos simétrico. El rango corresponde a 32. El intervalo con menos frecuencia es el de 50 a 54 y el de mayor frecuencia corresponde al de 34-38
b) Para la variable “Edad”, interprete las medidas de tendencia
central.
La media será obtenida a través de los datos extraídos del Excel, Por lo tanto, la distribución tiene una media de 36,25 años de edad. Respecto a la mediana respecto al historiograma pertenece al intervalo] 34-38], lo que significa que el dato central (50%) se encuentra en ese intervalo
Respecto al intervalo modal, este se encuentra en el intervalo] 34-38], lo que significa que este es el intervalo que posee mayor frecuencia.
3) Utilizando la información de la base de datos, realice lo siguiente: a) Construya una tabla bidimensional de frecuencia absoluta que resuma la información con respecto a las variables “rango de tiempo” y “experiencia”.
Rango de tiempo experiencia alta media baja total
0,8-1,4 1 3 1 5
1,4-2 16 12 7 35
2-2,6 41 44 15 100
2,6-3,2 18 16 4 38
3,2-3,8 0 2 0 2
total 76 77 27 180
b) Determine el porcentaje de conductores con experiencia alta o media y si tienen un tiempo de reacción sobre 2,0 segundos.
De acuerdo a las características dadas existen 103 conductores que cumplen, lo que equivale a 57,2%
c) Determine el puntaje promedio de los conductores con experiencia alta y un tiempo de reacción de a lo más 2,6 segundos.
De un total de 65 conductores, se obtiene un puntaje promedio de 22,3910614
4) Considerando que la variable “Tiempo de reacción” que depende de la variable “Nivel de Alcohol”. Con esta información:
a) Construya un gráfico de dispersión que relacione las variables mencionadas. Incluya la línea de tendencia lineal con su respectivo coeficiente de determinación.
Nivel de alcohol vs tiempo de reaccion 4.0 3.5 3.0 2.5 2.0 1.5
y = 0.9561x + 1.0126 R² = 0.8494
1.0 0.5 0.0 0.0
0.5
1.0
1.5
2.0
2.5
3.0
b) Interprete el coeficiente de determinación del modelo de regresión lineal.
El coeficiente corresponde a un número cercano a 1, por lo tanto, existe evidencia para relacionar estas 2 variables de manera lineal.
c) Utilizando el modelo lineal, estime el tiempo de reacción de un conductor que marcó 1,8 gramos por litro de alcohol en la sangre.
Dada la ecuación en el modelo y= 0.9561 *x +1.0126, para una persona que marco 1.8 gramos por litros de alcohol, se estima un tiempo de reacción de 2.733 s
5) Considerando que la variable número de conductores seleccionados de un determinado género en un conjunto de n conductores, es una variable aleatoria con distribución binomial, realice las siguientes actividades: a) Construya una tabla de distribución de frecuencias relativas, con la variable género.
Genero Masculino Femenino Total
f 132 48 180
f relativa 0,73333333 0,26666667 1
b) Si se seleccionan 30 vendedores (no será conductores) al azar, ¿cuál es la probabilidad de que 22 de ellos sean de género masculino?
n=30 , k= 22 , p = 0.73 q= 0.26 Por lo tanto, la probabilidad es de 0,16283741
c) Si se eligen 25 vendedores al azar, ¿cuál es la probabilidad de que a lo más 8 de ellos sean de género femenino?
La probabilidad es de 0,79964881
6) Suponiendo que la base de datos constituye la población y considerando que la variable “Tiempo de reacción” de los conductores
es una variable aleatoria continua y que se distribuye normalmente, conteste las siguientes preguntas: a) ¿Cuál es el promedio y la desviación estándar poblacional de la variable tiempo de reacción de los conductores?
El promedio corresponde 2,2 y la desviación estándar es de 0,424768166, Por lo tanto, se tiene una población que distribuye de forma normal con (2.2, 0.424)
b) ¿Cuál es la probabilidad de que un conductor seleccionado al azar tenga un tiempo de reacción entre 2,1 y 3,2 segundos?
Para obtener estos valores se procede a tipificar. Z1=(3.2-2.2)/0.424 = 2.358 equivalente a 0.9906 Z2=(2.1-2.2)/0.424= -0.235 equivalente a 0.4090 Por lo tanto, para obtener este intervalo Z1-Z2 = 0.9906-0.4090 = 0.5816
De acuerdo a los datos presentados, existe un 58,16% de que, al escoger un conductor al azar, este tenga un tiempo de reacción entre 2,1 y 3,2 segundos.
CONCLUSIONES Para concluir este proyecto final del ramo estadística después de estas nueve semanas de estudio podemos sentir que estamos con los conocimientos claros para afrontar los desafíos en relación a la toma de decisiones para realizar asesoramientos en los procesos derivados de la estadística, cuando esta sea necesario dando así buenas respuestas e información de primera fuente entregando conocimientos sólidos y asesoramientos a la empresa o trabajo que se esté ejecutando consiguiente con lo anterior creo que después de estas semanas de estudios estamos más preparados para afrontar la vida con otra visión.
BIBLIOGRAFIA 1- Semana N° 1,2,3,4,5,6,7,8 ramo estadística Instituto IACC 2- Recursos adicionales del ramo estadística Instituto IACC
Proyecto final datos excel boris ull