ESTADISTICA DESCRIPTIVA MOMENTO 3
PRESENTADO POR: MIRIAM EVELIA ROSERO CÓD: 36.752.129 BENJAMIN ACOSTA CÓD: 15816693 JESSICA ALEJANDRA CAMELO CÓD: 1.030.606.085 YENY LORENA PAZ CÓD:
GRUPO: 100105_142
TUTOR: HECTOR IVAN BLANCO
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA ESCUELA DE CIENCIAS ADMINISTRATIVAS, CONTABLES, ECONÓMICAS Y DE NEGOCIOS – ECACEN MAYO- 2016.
INTRODUCCIÓN. Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes a la regresión y determinación mediante la realización de ejercicios empleando las medidas de regresión y correlación lineal simple y múltiple con variables cuantitativas que tienen que ver con el caso estudiado a cerca de los accidentes de tránsito en la ciudad de Medellín.
JUSTIFICACIÓN.
En el presente informe se compararon datos cuantitativos para determinar su correlación y de ésta manera analizarla, partiendo de una realidad que conocemos y entendemos se podrán formular propuestas encaminadas a la transformación de una realidad. Mediante un proceso gradual de clasificación, organización y tabulación de datos hemos analizado variables cualitativas y cuantitativas, lo que nos permite en éste momento elaborar un laboratorio apoyados en el análisis y fórmulas del programa Microsoft Excel. Además de todo esto el trabajo permite distintas perspectivas que complementan la entrega final, adquiriendo nuevas experiencias a través de la ejercitación de nuestras habilidades interpretativas y argumentativas que se reúnen en torno a un tema común en donde prevalece la objetividad; todo esto a través del trabajo colaborativo en donde asumiendo distintos roles potencializamos nuestras capacidades y aportamos desde nuestras experiencias y fortalezas, con responsabilidad y compromiso.
OBJETIVOS.
GENERAL Determinar la correlación entre dos variables cuantitativas a través de un laboratorio de regresión y correlación lineal ESPECÍFICOS
Analizar datos agrupados para encontrar su relación
Participar en la consolidación de un trabajo grupal que evidencie los aprendizajes adquiridos
Determinar la relación existente entre dos variables cuantitativas a través de las herramientas Infostat y Excel
LABORATORIO DE REGRESIÓN Y CORRELACIÓN LINEAL. 1-El rendimiento del producto de un proceso químico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos: X (% de Hidrocarburos) 0,99 1,02 1,15 1,29 1,46 1,36 0,87 1,23 1,55 1,4 1,19 1,15 0,98 1,01 1,11 1,2 1,26 1,32 1,43 0,95
Y (Pureza) 90,01 a. Realice el diagrama de dispersión y determine 89,05 el tipo de asociación entre las variables. 91,43 93,74 96,73 94,45 87,59 91,77 99,42 93,65 93,54 92,52 Posee tendencia 90,56 positiva y relación directa entre el % de hidrocarburo y la 89,54 pureza puesto que a medida que él % aumenta la pureza también aumenta es 89,85 decir que la pureza si depende del % de hidrocarburo. La ecuación matemática 90,39 es confiable93,25 en un 87,74%. 93,41 94,98 b. Encuentre el modelo matemático que permite 87,33 predecir el efecto de una variable sobre la otra.
Es confiable? y = 14,947x + 74,283
R² = 0,8774
R²= coeficiente de determinación = 87,74% por lo tanto es confiable c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. R= coeficiente de correlación
R= 0,93% La correlación es excelente
R= raíz cuadrada de 0,8774 d. ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3? y= pureza. x= hidrocarburo?. y= 91,3 91,3= 14,947x+74,283 91,3-74,283=14,947x 17,02/14,947=x x= 1,13 Cuando el oxígeno es igual a 91,3 el porcentaje del hidrocarburo será 1,13%.
2- El número de libras de vapor (y) consumidas mensualmente por una planta química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se registraron los siguientes valores de temperatura y consumo anual.
Mes
x Temperatura (°F)
y Consumo de vapor (Lb)
Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic.
21 24 32 47 50 59 68 74 62 50 41 30
185,79 214,47 288,03 424,84 455 539 621,55 675,06 562,03 452,93 369,95 273,98
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las variables. CONSUMO MENSUAL DE VAPOR POR UNA PLANTA QUIMICA 800 700
f(x) = 9.21x - 6.32 R² = 1
600 500
CONSUMO DE VAPOR (LB) 400 300 200 100 0 10
20
30
40
50
60
70
80
TEMPERATURA °F
Tendencia positiva, existe una relación directa entre la temperatura y el consumo de vapor, por lo tanto el número de libras de vapor consumidas mensualmente por una planta química si se relaciona con la temperatura la cual está representada en °F, su correlación es excelente con un 0,99%, la R² = 99,99 lo que significa que posee un alto grado de confiabilidad.
b. Encuentre el modelo matemático que permite predecir el efecto de una otra. Es confiable? y = 9,2087x - 6,3184
variable sobre la
R² = 0,9999
R²= coeficiente de determinación= 99,99 % lo cual es confiable. c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. R= coeficiente de correlación R= raíz cuadrada de 0,9999% R= 0,99% La correlación es excelente
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 °F?
y= consumo de vapor? x= temperatura en °F x= 70 °F y= 9,2087(70) + 6,3184 y= 644,609 + 6,3184 y= 650,9. Cuando la temperatura es igual a 70 °F el consumo de vapor será 650,9%
3-Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables aleatorias.
x (porcentaje de sobrepeso)
y (umbral de reflejo de flexión nociceptiva)
89 90 75 30 51 75 62 45 90 20
2 3 4 4,5 5,5 7 9 13 15 14
o b e s id a d y re s p u e s ta in d iv id u a l a l d o lo r 16 14 12 10 UMBRAL DE REFLEJO DE REFELXIÓN
8
f(x) = - 0.06x + 11.64 R² = 0.11
6 4 2 0 10 20 30 40 50 60 70 80 90 100 % DE SOBREPESO
a-
Realice
el
diagrama de dispersión y determine el tipo de asociación entre las variables.
b- Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la otra. Es confiable? y = -0,0629x + 11,642 R² = 0,1115 Tendencia negativa, existe una relación inversa entre % de sobrepeso y el umbral de R²= coeficiente de determinación = 11,15 % por lo tanto no es confiable reflejo de flexión a medida que aumenta el % de sobrepeso, disminuye el Umbral de reflejo de flexión, la correlación entre lasdel dosmodelo variables es grado mínima un 0,33%, c-Determine el porcentaje de explicación y el decon relación de lastambién dos es posible afirmar que este modelo no es recomendable puesto que posee un grado de variables. confiabilidad muy bajo por tener un R²= 11,15%. R=coeficiente de correlación R= raíz cuadrada de 0,1115 R= 0,33% La correlación es mínima
VEL OCI DA D (X)
NU M ER O DE HE RI DO S (Y) 66 3 d-¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje 111 2 de sobrepeso, de 40? 66 1 80 2 75 8 y= umbral de reflejo de flexión nociceptiva? 66 0 x= porcentaje de sobrepeso 45 0 88 4 X= 40 % Sobrepeso 55 2 y= (-0,0629) (40)+ 11,642 70 6 y= -2,516 + 11,642 105 4 y= 9.126 88 1 69 2 Cuando el porcentaje de sobrepeso es de 40%, el umbral de 48 0 reflejo de flexión nociceptiva es de 9,126. 70 2 83 2 138 3 68 4 REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE 77 2 81 5 Identificar dos variables cuantitativas de la situación estudiada que puedan estar 50 2 relacionadas. 88 4 71 2 NUMERO Y 55 0 DE HERIDOS DEPENDIENTE VELOCIDAD INDEPENDIENTE X 78 2 80 1 68 1 74 3 75 4 83 9 65 0 60 3 83 15 95 2 86 2 68 0 55 1 88 0 63 2 70 0 78 4 83 2 138 3 55 0 66 2
INDICES ACCIDENTALIDAD EN MEDELLIN 20 15
NUMERO DE HERIDOS 10 5 0 20
f(x) = 0.03x + 0.35 R² = 0.05 40
60
80
100
120
140
160
VELOCIDAD Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable? y= 0,033x + 0,3492
R² = 0,0453
R² = coeficiente de determinación= 4,53 % por lo tanto no es confiable. Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. R= Coeficiente de correlación R= Raíz cuadrada de 0,0453 R= 0,21 % No hay correlación Relacionar la información obtenida con el problema. En el caso estudiado referente a la accidentabilidad en la Ciudad de Medellín el grado de confiabilidad entre las variables Velocidad y Número de heridos es de 4,53%, lo cual significa
que no es confiable, no existe correlación entre ellas ya que su coeficiente corresponde a 0,21%, por lo tanto el número de heridos no depende de la velocidad de los conductores. REGRESIÓN Y CORRELACIÓN LINEAL MÚLTIPLE Identificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigación. y x1 NUMERO VELOCID DE AD MUERTOS
0 1 1 0 0 2 1 2 0 1 0 3 1 2 1 0 0 1 1 1 0 2 1 3 1 0
66 111 66 80 75 66 45 88 55 70 105 88 69 48 70 83 138 68 77 81 50 88 71 55 78 80
x2 GRADOS DE ALCOHOL DEL CONDUCT OR 1,2 3,0 0,0 0,6 0,0 0,0 3,0 1,4 2,1 0,0 1,6 2,2 3,0 1,1 2,4 0,6 1,6 0,0 0,0 2,1 1,4 2,6 3,0 2,7 0,6 0,0
1 0 1 2 2 2 1 0 0 2 1 4 0 2 0 2 2 1 0 1 0 1 0 0 1 1 0 1 1 0 0 1 0 1 0 1 0 2 1 1
68 74 75 83 65 60 83 95 86 68 55 88 63 70 78 83 138 55 66 108 69 72 74 69 79 65 74 77 51 75 72 77 67 55 40 73 69 70 75 55
2,9 0,6 1,8 0,0 1,1 2,4 0,6 0,0 2,9 1,3 1,4 2,1 0,8 0,0 1,2 3,0 0,0 0,6 1,9 2,7 1,1 2,4 0,6 1,6 0,0 1,4 2,1 0,8 1,1 2,4 0,0 1,6 1,2 3,0 2,7 0,6 0,0 3,0 1,1 2,4
1 0 0 1 0 2 1 1 0 0 2 0 1 0 1 0 0 2 3 1 0 0 1 2 0 1 2 0 1 2 0 1 0 0 1 1 0 0 2 1
69 50 73 38 60 50 100 75 80 95 70 66 69 67 83 70 150 55 66 68 79 79 60 33 85 80 81 62 79 76 80 70 80 83 68 79 79 80 75 66
0,0 1,6 0,0 0,8 0,3 1,1 2,4 0,6 0,0 1,2 3,0 2,7 0,6 1,9 1,1 0,0 0,6 1,6 2,1 0,8 0,5 2,7 1,1 2,4 0,6 1,6 1,4 2,1 0,0 3,0 0,0 0,6 1,9 1,4 0,0 2,7 0,6 1,9 2,5 3,0
0 0 1 1 1 0 2 1 0 1 0 2 1 1
45 77 81 50 88 71 55 78 67 55 40 73 69 70
0,6 0,0 2,7 1,3 2,1 0,0 2,6 3,0 2,7 0,6 1,9 3,0 1,1 2,4
Realizar el diagrama de dispersión de dichas variables.
RELACIÓN: NUMERO DE MUERTOS Vs VELOCIDAD 4.5 4 3.5 3 2.5 NUEMRO DE MUERTOS
2 1.5 1 0.5 0 20
40
60
80
100
VELOCIDAD
120
140
160
RELACION: NUEMERO DE MUERTOS VS GRADOS DE ALCOHOL 4.5 4 3.5 3 2.5
NUMERO DE MUERTOS
2 1.5 1 0.5 0 0.0
0.5
1.0
1.5
2.0
2.5
3.0
GRADOS DE ALCOHOL
Resumen Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0,264226981 0,069815897 0,053915314 0,82971621 120
ANÁLISIS DE VARIANZA Grados de libertad Regresión
2
Residuos
117
Total
119
Suma de cuadrados 6,04547491 7 80,5461917 5 86,5916666 7
Promedio de los Valor crítico cuadrados F de F 3,02273745 8 4,39077596 0,014497109 0,68842898 9
3.5
Coeficie ntes Intercep 0,69339 ción 6471 Variable 0,00187 X1 0908 Variable 0,21383 X2 7562
Error Estadísti Probabil Inferior Superior Inferior Superior típico co t idad 95% 95% 95,0% 95,0% 0,34775 1,99391 0,048487 0,00468 1,38211 0,00468 1,382110 6788 2107 59 2397 0544 2397 544 0,00432 0,43274 0,665999 0,01043 0,00669 0,01043 0,00669 3386 1376 3 3148 1332 3148 1332 0,07404 2,88774 0,004623 0,06718 0,36048 0,06718 0,36048 9969 6795 41 5483 9641 5483 9641
y= 0,69339+ (-0,00187x1)+0,21383x2 y= 0,69339-0,00187x1+0,21383x2 Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación. R^2=0,0698*100 R^2=6,98% El modelo matemático es confiable en un 6,98% R=0,26 No hay correlación entre las variables
Relacionar la información obtenida con el problema. Los resultados estadísticos obtenidos indican que no hay relación entre las variables: número de muertos, grados de alcohol y velocidad, esto lo podemos identificar mediante el modelo matemático de regresión múltiple, y= 0,69339-0,00187x1+0,21383x2, a lo cual solo podemos obtener un 6,98% de confiabilidad, teniendo en cuenta que el intervalo de correlación es
invalida o no hay correlación alguna. Por consiguiente e claro decir que los muertos dentro de la accidentalidad en la ciudad de Medellín no dependieron de los grados de alcohol ni la velocidad.
CONCLUSION Se puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de los lineamientos expuestos por la universidad nacional abierta y a distancia UNAD, entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determina da investigación.
REFERENCIAS BIBLIOGRÁFICAS
Estadística descriptiva. Campus virtual UNAD http://campus03.unad.edu.co/ecbti04/mod/forum/view.php?id=3900
Ortegón Pava, Milton Fernando. Análisis de las medidas univariantes https://www.youtube.com/watch?v=Ktk263q-W-4
Jeanete Buitrago, Cecilia Cárdenas. Fundamentos de estadística. Universidad Santo Tomás, 2013