Facultad de Ingeniería y Ciencia Básicas Estadística II Modalidad Virtual
La siguiente serie de ejercicios se dividirán en dos partes, la primera tendrá una fecha de realización hasta el jueves de la semana 4, 4, y finalizando finalizando la semana semana 6 la segunda segunda parte, parte, el documento documento final final y consolidación consolidación del trabajo debe ser subido en pdf en el (Foro: Desarrollo del trabajo Semana 2 - 7) en cada uno de los respectivo grupos a más tardar el jueves de la semana 7. El documento final debe tener: Portada de los que participaron activamente en el foro, Solución de los problemas planteados, conclusiones y referencia. Todos los puntos deben ser justificados, en caso de hacer uso de una hoja de cálculo debe ser también adjuntada en el foro. Para mayor detalle: detalle : https://www.youtube.com/watch?v=MTLbHXeJoeo
Contexto A continuación, continuación, se tiene la información de la Gran Encuesta Integrada Integrada de Hogares (GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11 ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas (si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo), además de las características generales de la población como sexo, edad, estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera - resto, regional, departamental, y para cada una de las capitales de los departamentos. Este trabajo colaborativo, tiene 5 actividades diferentes. Cada actividad corresponde a un tema de los cuales se desarrolla durante el módulo. El grupo debe resolver cada actividad e ir plasmando los resultados en el documento en línea. Los niveles de cada actividad varían según el tema que se esté desarrollando. Sin embargo, cabe aclarar que las actividades son independientes. Los temas que se desarrollan en este documento van hasta la semana 7. En el archivo de Excel ( https://goo.gl/sDSVDm ) se tiene información sobre las características generales de las personas que respondieron en un mes en particular. Para este trabajo colaborativo, realice lo siguiente:
Parte 1
Tamaño de muestra
Utilizando la variable edad (P6040), realice lo siguiente: ●
Realice un histograma y describa la información según la forma y la curtosis de los datos.
●
Realice una descripción numérica y descripción como es la población.
●
Calcule una nueva variable que sea el
●
Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente fórmula:
Donde, se tiene lo siguiente: Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca. S: Es la desviación estándar de la variable. Es el margen de error absoluto. Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto que no supere 0.5. ●
Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra, utilizando el algoritmo del coordinado negativo.
●
Compara la media poblacional, con la media muestral y determine la variación relativa.
Intervalo de confianza para dos variables numéricas Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente: ●
Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias?
●
Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de resultados.
●
Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la escolaridad de los hombres y de las mujeres de forma individual.
●
Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los niveles de escolaridad para los hombres y mujeres.
Parte 2 Prueba de hipótesis para dos variables nominales Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de “muestra” y realizar lo siguiente: ●
Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen diferencias?
●
Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un establecimiento oficial.
●
Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un establecimiento oficial.
●
Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?
[1]
http://www.dane.gov.co/files/investigaciones/fichas/empleo/ficha_metodologica_GEIH-01_V10.pdf