FACULTAD DE CIENCIAS Y TECNOLOGÍA
RED NACIONAL UNIVERSITARIA
SYLLABUS Facul Facultad tad de Cienci Ciencias as y Tecnol Tecnología ogía Ingeniería de Sistemas, Sistemas, Telecom Telecomunic unic aciones
PROBABILIDAD Y ESTADÍSTICA CUARTO SEMESTRE Gesti Gestión ón Académica I/201 I/2011 1 …
Lic. Lic . ADM. Edgar Edgar Martínez Calderón
U N I V E R S I D A
D E
A Q U I N O 1
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
UDABOL UNIVERSIDAD DE AQUINO BOLIVIA Acreditada como PLE P LENA NA mediante mediante R. M. 288/01
VISION DE L A UNIVERSIDAD Ser la Universidad líder en calidad educativa.
MISION DE LA UNIVERSIDAD Desarrollar la Educación Superior Universitaria con calidad y competitividad al servicio de la sociedad.
Estimado(a) estudiante: El syllabus que ponemos en tus manos es el fruto del trabajo intelectual de tus docentes, quienes han puesto sus mejores empeños en la planificación de los procesos de enseñanza para brindarte una educación de la más alta calidad. Este documento te servirá de guía para que organices mejor tus procesos de aprendizaje y los hagas mucho más productivos. Esperamos que sepas apreciarlo y cuidarlo.
U N I V E R S I D A
D E
A Q U I N O 2
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
I. Asignatura: Código: Requisito: Carga Horaria: Horas teóricas Horas prácticas Créditos:
Probabilidad y Estadística MAT 113A MAT 111A 80 60 20 4
II. OBJETIVOS GENERALES DE LA ASIGNATURA. Al Al fin final del curso rso el estud tudian iante, te, podrá efec fectua tuar desarro rrollo llo cien ientífi tíficco de inv investig tigacion iones que permit rmita a inc increm rementar tar el conocimiento sobre fenómenos fenómenos relacionados relacionados con con el campo de la Ingeniería, Ingeniería, y estar debidamente debidamente capacitado para resolver problemas de estadística descriptiva y estimación de parámetros, pruebas de hipótesis hipótesis y estudi estudio o de de regresión, regresión, encaminados encaminados al análisis análisis e interpret interpretación ación de datos muéstral muéstrales es para hacer hacer inferencias poblacionales y realizar pronósticos. III. PROGRAMA PROGRAMA ANALÍTICO ANAL ÍTICO DE LA ASIGNATU A SIGNATURA RA UNIDAD I. ESTADISTICA DESCRIPTIVA TEMA1. INTRODUCCIÓN A LA ESTADÍSTICA 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9
Definición Estadística Descriptiva Estadística Inferencial Población Muestra Parámetro Estadígrafo Observación de Sección Transversal Transversal Observación en Series Series de Tiempo
TEMA 2. DISTRIBUCIONES DE FRECUENCIA 2.1 Introducción 2.2 Alcance 2.3 Rango 2.4 Intervalos de Clase 2.5 Límit Límites es de de Clase 2.6 Amplitud de Clase 2.7 Frecuencia Absoluta 2.8 Marca de Clase 2.9 Frecuencia Frecuencia Relativa Relativa 2.10 Frecuencia Frecuencia Relativa Relativa Porcentual 2.11 Frecuencia Absoluta Absoluta Acumulada Acumulada
U N I V E R S I D A
D E
A Q U I N O 3
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
2.12 Frecuencia Relativa Relativa Acumulada Acumulada 2.13 Frecuencia Relativa Relativa Acumulada Acumulada Porcentual 2.14 Histogramas 2.15 Polígono de Frecuencias 2.16 Función Escalonada 2.17 Ojiva TEMA 3. MEDIDAS DE CENTRALIZACIÓN, POSICIÓN Y FORMA 3.1 Introducción 3.2 Media Aritmética 3.3 Métodos Métodos abreviados de Cálculo de la Media Media Aritmé Aritmétitica ca 3.4. Media Aritmética Ponderada 3.5 Mediana 3.6 Moda 3.7 Relaci Relaciones ones entre la Media, Media, Mediana y Moda Moda 3.8 Media Media Geométri Geométrica ca 3.9 Media Armónica 3.10 Comp Comparación aración entre la Media Media Aritmética, Aritmética, Media Media Geom Geométri étrica ca y Media Media Armónica Armónica 3.11 Cuantil Cuantiles es 3.11.1 Cuartiles 3.11.2 Decil Deciles es 3.11.3 Percentiles 3.12 Coefi Coeficiente ciente de Asimetría 3.13 Coefici Coeficiente ente de Curtosis Curtosis TEMA 4. MEDIDAS DE DISPERSIÓN 4.1 Introducción 4.2 Rango 4.3 Desviación Intercuartil 4.4 Desviación Media 4.5 Desviación Mediana 4.6 Varianza 4.7 Propiedades de la Varianza 4.8 Métodos Métodos abreviados de cálculo cálculo de la Varianza 4.9 Desviación Estándar 4.10 Aplicaciones Aplicaciones en en el ordenador ordenador UNIDAD II. ESTADÍSTICA INFERENCIAL INFERENCIAL TEMA 5. TEORÍA TEORÍA ELEMENTAL ELEMENTAL DE LA PROBABILIDAD 4.1 4.2 4.3 4.4 4.5 4.6 4.7
Introducción Experimento Aleatorio Experimento Simple Experimento Compuesto Compuesto Espacio Muestral Espacio Espacio Muestral Muestral Discreto Espacio Muestral Continuo
U N I V E R S I D A
D E
A Q U I N O 4
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
4.8 Evento 4.9 Suceso 4.10 Experimentos unidos por por la “o” Excluyente 4.11 Experimentos unidos por por la “y” 4.12 Defi Definición nición de Probabili Probabilidad dad 4.13 Consideraciones 4.14 Probabilidad Condicional 4.15 Teoremas de la Probabilidad Condicional 4.16 Permutaci Permutaciones ones de n objetos diferentes diferentes 4.17 Permutaci Permutaciones ones de n objetos diferentes diferentes tomados de r a r 4.18 Permutaciones Circulares 4.19 Permutaciones con Repeticiones 4.20 Combinaciones 4.21 Consideraciones TEMA: 6. LAS LA S DISTRIBUCIONES DISTRIBUCIONES BINOMIAL, NORMAL Y DE POISSON 5.1 5.2 5.3 5.4 5.5 5.6
Introducción La distribución distribución Binomial Binomial y sus propiedades propiedades La distribución Normal y sus propiedades Relación entre las distribuciones Binomial y Normal La distribución de Poisson y sus propiedades Relaciones entre las distribuciones Binomial y de Poisson
UNIDAD III. TEMA 7. MUESTREO 6.1 Introducción 6.2 Muestreo 6.3 Definición 6.4 Población 6.5 Definición 6.6 Muestra Muestra Aleatoria Aleatoria 6.7 Distribución DistribuciónChi-Cuadrado Chi-Cuadrado 6.7.1 Definición 6.7.2 Tablas Tablas para la distribución distribución ChiChi-Cu Cuadrado adrado 6.8 Distribución T –Student 6.9 Distribución F 6.10 Determinación de tamaños de la muestra 6.9.1 Intervalos de de confiabilidad confiabilidad para la media media de una población población 6.9.2 Intervalo de confiabilidad confiabilidad para la varianza de una población 6.10 Determinación del tama tamaño ño de de la muestra muestra TEMA 8. TEORIA TEORIA ESTADÍSTICA DE LAS LA S DECISIONES DECISIONES 7.1 Introducción 7.2 Decisi Decisione oness estadísticas estadísticas 7.3 Hipótesis estadísticas 7.4 Contrastes de hipótesis y significación 7.5 Tipos de errores U N I V E R S I D A
D E
A Q U I N O 5
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
7.6 Niveles de significación 7.7 Contrastes mediante la distribución normal 7.8 Contrastes de una y de dos colas 7.9 Contrastes mediante diferencias muéstrales TEMA 9. INTRODUCCION A LA TEORÍA DE CORRELACIÓN 8.1 8.2 8.3 8.4
Introducción Regresión lineal simple Propiedades de los estimadores de mínimos cuadrados Inferencias en la regresión lineal
IV. TRABAJO DE BRIGADAS NOMBRE DEL PROYECTO: Aplicaciones de la Estadística Descriptiva OBJETIVO: Poner en practica las herramientas que proporciona la Estadística Descriptiva para poder abordar necesidades en cuanto a la recolección, organización, presentación y descripción de información; la misma que sirva como apoyo en la toma de decisiones . MATERIAS DIRECTAS: - Probabilidad y Estadística MATERIAS INDIRECTAS:
TRABAJO A REALIZAR POR LOS ESTUDIANTES
Coordinar entre los estudiantes y docentes de las materias directas e indirectas, y estructurar el cuestionario para la recolección de la información.
U N I V E R S I D A
LOCALIDAD, AULA O LABORATORIO
INCIDENCIA SOCIAL
FECHA
Estudiantes de 4to semestre, capacitados en la Aulas de la Facultad elaboración de de Ciencias y cuestionarios, como Tecnología herramienta de en la recolección de información.
D E
A Q U I N O 6
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Realizar el proceso de: •
Recolección
•
Clasificación
Ambientes de la Facultad de Ciencias y Tecnología
Estudiantes mejor preparados para poner en práctica las herramientas que brinda la estadística en la parte de recolección y clasificación de datos.
•
Realizar el proceso de: •
Presentación
•
Descripción
•
Interpretación
U N I V E R S I D A
Aulas de la Facultad de Ciencias y Tecnología
D E
•
Estudiantes mejor preparados para poner en práctica las herramientas que brinda la estadística en la parte de presentación, descripción e interpretación de datos. Información disponible sobre la institución donde se realizo el trabajo, la misma que sirva como apoyo en la toma de decisiones en niveles superiores de la institución.
A Q U I N O 7
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
VI. SISTEMA DE EVALUACIÓN DE APRENDIZAJES. EVALUACIÖN PROCESUAL (50%)
EVALUACIÓN DE RESULTADOS (50%)
Se tomara en cuenta el promedio de los Se tomara en cuenta los siguientes ítems para siguientes ítems para cada evaluación parcial: cada evaluación parcial y evaluación final: -
Resolución y entrega practicas Resolución y entrega de Work Paper’s Trabajo con los Dif’s Participación en clases Presentación de archivador de la materia
-
Examen de la materia Participación en brigadas
Nota: El estudiante debe de tener el 80 % de asistencia durante el semestre para estar debidamente habilitado a rendir su evaluación final VII.
BIBLIOGRAFIA BASICA Y COMPLEMENTARIA. Bibliografía básica: • • •
MURRAY SPIEGEL “Estadística”, Editorial Mc Graw Hill RUFINO MOYA, “Probabilidad e Inferencia Estadística”, Editorial San Marcos VICTOR CHUNGARA CASTRO, “Estadística y Probabilidades”, Editorial Leonardo
Bibliografía complementaria: •
• • •
•
•
MILLER IRWIN R.; Freund John E.; Johnson Richard, “ Probabilidad y Estadística para ingenieros”, Editorial Prentice-Hall Hispanoamericana C. GARCIA ORE, “Estadística Descriptiva y Probabilidades”, Editorial Gómez MEYER PAUL, “Probabilidad y aplicaciones estadísticas”, Addison Wesley WONNACOTT THOMAS H.; WONNACOTT RONALD J., “Introducción a la Estadística”, Limusa, México MENDENHALL WILLIAM; WACKERLY DENNIS D.; SCHEAFFER RICHARD L. , “Estadística Matemática con Aplicaciones”, Editorial Ibero América. SEBASTIAN LAZO “Algebra Moderna”, Editorial SOIPA Ltda.
VIII. CONTROL DE EVALUACIONES 1° evaluación parcial Fecha: Nota: 2° evaluación parcial Fecha: Nota: Examen final Fecha:
U N I V E R S I D A
D E
A Q U I N O 8
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Nota: APUNTES
U N I V E R S I D A
D E
A Q U I N O 9
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
IX. PLAN CALENDARIO UNIVERSIDAD DE AQUINO-BOLIVIA UNIDAD ACADÉMICA DE ORURO
CALENDARIO ACADÉMICO GESTIÓN I/2011 TURNOS REGULAR-TRABAJO ESTUDIANTES NUEVOS-ANTIGUOS SEMANA
DEL
AL
ACTIVIDADES
OBSERVACIONES
1ra. 2da.
09-Mar 14-Mar
12-Mar 19-Mar
Avance de materia Avance de materia
3ra. 4ta. 5ta.
21-Mar 28-Mar 04-Abr
26-Mar 02-Abr 09-Abr
Avance de materia Avance de materia Avance de materia
6ta.
11-Abr
16-Abr
Avance de materia
7ma.
18-Abr
23-Abr
Avance de materia
8va. 9na.
25-Abr 02-May
30-Abr 07-May
Avance de materia Avance de materia
10ma. 11ra. 12da.
09-May 16-May 23-May
14-May 21-May 28-May
Avance de materia Avance de materia Avance de materia
13ra. 14ta. 15ta.
30-May 06-Jun 13-Jun
04-Jun 11-Jun 18-Jun
Avance de materia Conclusión Segunda Evaluación Parcial Presentación de Notas Avance de materia Avance de materia
16ta. 17ma. 18va. 19na.
20-Jun 27-Jun 04-Jul 11-Jul
25-Jun 02-Jul 09-Jul 16-Jul
Avance de materia Avance de materia Inicio Evaluación Final
20va. 21ra.
18-Jul 25-Jul
23-Jul 26-Jul
Inicio Prim era Evaluación Parcial Conclusión Primera Evaluación Parcial
Presentación de Notas
Inicio Segunda Evaluación Parcial
Presentación de Notas
Presentación de Notas
Conclusión Evaluación Final
Presentación de Notas Transcripción de Notas
Evaluación del segundo t urno
Transcripción de Notas
Cierre de Gestión
FERIADOS 22 de abril Viernes Santo 1 de mayo Día del Trabajo 23 de junio Corpus Christi
U N I V E R S I D A
D E
A Q U I N O 10
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
X. PLANIFICACIÓN DE ACTIVIDADES
CONTENIDO MÍNIMO
CONTENIDO ANALÍTICO
ACTIVIDAD
PERIODOS ACADÉMICO S
RECURSOS DIDACTICOS Pizarra Material de apunte Proyector Computador −
APLICACIONES DE LA ESTADISTICA DESCRIPTIVA
− − − −
LA ESTADISTICA EN EL DESARROLLO DE SW. INFOMATICO APLICACIONES DE LA ESTADISTICA DESCRIPTIVA E INFERENCIAL
− − − −
− −
Recolección de Información Clasificación de información Presentación de Información Descripción de Información
BRIGADAS DE AULA ABIERTA
Objetivos Importancia Rol Limitaciones
CLASE MAGISTRAL
6 PERIODOS
− −
Material de apunte Computador Proyector −
8 PERIODOS
− −
Aplicaciones Descriptivas Aplicaciones Inferenciales
U N I V E R S I D A
−
TRABAJO DE INVESTIGA CIÓN
D E
4 PERIODOS
A Q U I N O 11
Material de apunte Computador Proyector −
− −
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
WORK PAPER # 1
PROGRAMA DE CONTROL DE CALIDAD
No. DE PROCEDIMIENTO: APRO 07
No. DE HOJAS: 7
ELABORÓ: Lic. ADM. Edgar Martínez Calderón
CÓDIGO: MAT 113A
TÍTULO DEL WORK PAPER: ESTADISTICA DESCRIPTIVA DPTO.: Facultad de Ciencias y Tecnología DESTINADO A: DOCENTES
ALUMNOS
X
ADMINIST.
OTROS
OBSERVACIONES: Ingeniería de Sistemas, Telecomunicaciones, Gas y Petróleo, Estadística, Unidad I
Probabilidad y
FECHA DE DIFUSIÓN:
FECHA DE ENTREGA:
U N I V E R S I D A
D E
A Q U I N O 12
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
ESTADÍSTICA DESCRIPTIVA DEFINICIÓN.
Puede definirse como aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto de datos. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS .
Se conoce como distribución de frecuencia ó tablas de frecuencia a toda ordenación de datos obtenida en un fenómeno de un experimento estadístico en clases. Una tabla de distribución de frecuencia puede expresarse: • •
En cifras absolutas (frecuencias absolutas) En cifras relativas (frecuencias relativas)
La frecuencia relativa expresa la proporción en que un determinado valor de la variable participa en el conjunto; la frecuencia relativa la podemos expresar en forma de proporción f / n, o bien en forma de porcentaje (f / n ) x 100. f = frecuencia. n = número total de observaciones. A continuación se señalaran las principales características que son parte de las tablas de frecuencia o de los datos agrupados: CLASE O CATEGORÍA:
Es el par de valores ordenados separados por un guión y que también se conoce como intervalo de clase. LÍMITES DE CLASE:
Los números extremos de una clase o categoría se les conocen como límites de clase y son el límite inferior y el límite superior. TAMAÑO O AMPLITUD DE CLASE:
Es la diferencia entre los límites de las clases que lo conforman. MARCA DE CLASE:
Es el punto medio de una clase o categoría y se obtiene sumando los límites superior e inferior de la clase y dividiendo entre 2.
U N I V E R S I D A
D E
A Q U I N O 13
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
REGLAS GENERALES PARA LA FORMACIÓN DE UNA TABLA DE DISTRIBUCIÓN DE FRECUENCIA • • • •
Obtener el rango Determinar el número de clases deseado Determinar la anchura o amplitud de clase Determinar el número de observaciones que caen dentro de cada clase
GRAFICACIÓN DE DATOS ESTADÍSTICOS. HISTOGRAMA
A menudo se dice que “una imagen vale mas que mil palabras”. De hecho los estadísticos han empleado las técnicas gráficas han empleado las técnicas gráficas para describir de manera más vívida series de datos. En particular, los histogramas se usan para describir datos numéricos que han sido agrupados en distribuciones de frecuencia. Un histograma, consiste en una serie de rectángulos cuyo ancho es proporcional al alcance de los datos, que se encuentran dentro de una clase y cuya altura es proporcional al número de elementos que caen dentro de la clase. MEDIDAS DESCRIPTIVAS PARA DATOS AGRUPADOS.
En ocasiones se necesitan calcular las diversas medidas descriptivas a partir de datos que han sido agrupados en intervalos de clase y presentados como una distribución de frecuencia. Si los datos consisten en una gran cantidad de valores, y si los cálculos se tienen que hacer en forma manual o con una calculadora, se puede ahorrar una gran cantidad de trabajo agrupando los datos antes de calcular las medidas descriptivas. Cuando se calculan medidas descriptivas a partir de datos agrupados, se deben hacer ciertas suposiciones respecto a los datos. Como una consecuencia de hacer estas suposiciones, los valores de las medidas descriptivas calculados de esta manera se deben considerar como aproximaciones a los valores verdaderos. LA MEDIA.
Cuando se calcula la media a partir de datos agrupados, se hace la suposición de que cada observación que cae dentro de un intervalo de clase determinado es igual al valor del punto medio de ese intervalo. El punto medio de un intervalo de clase es llamado marca de clase. Se obtiene la marca de clase sumando los límites de clase respectivos y dividiéndolos entre 2. En vista de que cada observación toma el valor de la marca de clase del intervalo en el que cae, se calcula la media multiplicando cada marca de clase por su frecuencia correspondiente. Luego se suman los productos resultantes y se divide el total entre el número de observaciones. Se puede expresar el procedimiento para datos de muestra por: k
∑ xi f i x = Donde:
i =1
n
k = El número de intervalos de clase. x i = La marca de clase del i-ésimo intervalo de clase. f i = la frecuencia del i-ésimo intervalo de clase. U N I V E R S I D A
D E
A Q U I N O 14
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
LA MEDIANA.
La mediana para una distribución de frecuencia es el valor, o punto, sobre el eje horizontal del histograma de la distribución en el que una línea perpendicular divide el área del histograma en dos partes iguales.
n
~ = L + 2 x m : Donde
− F m−1 ⋅c
f m
Lm = Límite inferior de la clase mediana. n = Número de datos. Fm-1 = Frecuencia acumulada de la clase que antecede a la clase mediana. f m = Frecuencia de la clase mediana. c = Longitud del intervalo de la clase mediana.
LA MODA.
Cuando se trata de datos agrupados para hallar la moda debemos determinar antes que todo la clase modal en la cual se halla ésta. Dicha clase corresponde a aquella que presente mayor frecuencia (absoluta). Una vez localizada la clase modal, procedemos por interpolación para determinarla. Esta interpolación nos conduce a la siguiente fórmula para la media:
xˆ = Lm +
d 1 d 1 + d 2
⋅c
Donde:
L m = Límite inferior de la clase modal (la clase de mayor frecuencia). d 1 = Diferencia entre la frecuencia de la clase modal y la de la clase que la antecede. d 2 = Diferencia entre la frecuencia de la clase modal y la de la clase que le sigue. c = Longitud del intervalo de la clase modal. MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS.
Se hace la misma suposición respecto a los valores asumidos por las observaciones cuando se calculan las medidas de dispersión a partir de datos agrupados
VARIANZA: k
∑ f i ( xi − x) Para una muestra:
2
s =
2
i =1
U N I V E R S I D A
n −1
D E
A Q U I N O 15
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
k
∑ f i ( xi − µ ) σ
Para una población:
2
=
2
i =1
N
DESVIACIÓN ESTÁNDAR:
k
∑ f i ( xi − x) s=
Para una muestra:
2
i =1
n −1
k
∑ f i ( xi − µ ) σ
Para una población:
=
2
i =1
N
MEDIDAS DE POSICIÓN PARA DATOS AGRUPADOS.
Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión, son otras medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones en las que se busca describir la variación o dispersión en un conjunto de datos. CUANTILES
Los cuantiles son medidas de posición que se determinan mediante un método que determina la ubicación de los valores que dividen un conjunto de observaciones en partes iguales. Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes; los deciles, cuando dividen la distribución en diez partes y los centiles o percentiles, cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensión de la mediana. Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u): u
Q(u)
0.5 0.25, 0.75 0.1, ... , 0.99 0.01, ..., 0.99
Mediana Cuartiles Deciles Centiles
CUARTILES
U N I V E R S I D A
D E
A Q U I N O 16
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
n − F k 4
k Q k = L k +
f k
*c
Datos Agr upados Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3 Donde: Lk = Límite real inferior de la clase del cuartil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento académico. Datos Ag rupados n − F k 10
k Dk = L k +
f k
*c
Para datos agrupados los deciles se calculan mediante la fórmula. k= 1,2,3,... 9 Donde:
Lk = Límite real inferior de la clase del decil k n = Número de datos
U N I V E R S I D A
D E
A Q U I N O 17
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc. Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99. Datos Agr upados Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula: k= 1,2,3,... 99 n − F k 100
k Pk = L k +
Donde:
f k
*c
Lk = Límite real inferior de la clase del decil k n = Número de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k CUESTIONARIO
1.- Los siguientes datos representan las notas de 60 estudiantes en la materia de probabilidad y estadística de la facultad de ingeniería. 72 48 36 91 79 80
49 47 24 49 49 35
90 83 85 39 58 49
94 38 88 49 39 58
64 48 77 44 96 41
48 83 49 49 63 39
47 64 86 49 34 35
46 66 82 80 39 48
60 45 49 36 50 59
54 80 70 74 39 36
Se pide: A.
Calcular y realizar su respectiva interpretación de: -
Media Moda Mediana
U N I V E R S I D A
D E
A Q U I N O 18
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
-
Desviación estándar Coeficiente de variación
B. Elaborar: Histograma (Ii vs. f i ) Polígono de frecuencias Función Escalonada (I i vs. Fi) Ojiva 2.- Los siguientes datos constituyen las vidas útiles en días, de una muestra aleatoria de 60 equipos de computación : -
807 660 881 766 1056 832
811 753 872 787 1076 863
620 1050 869 923 958 852
650 918 841 792 970 788
817 857 847 803 776 980
732 867 833 933 828 889
747 675 829 947 831 1030
823 880 827 717 781 897
844 878 822 817 1088 755
907 890 811 753 1082 891
-
A.- Construir la Tabla de Distribución de Frecuencias y graficar su correspondiente polígono de frecuencias (Ii vs f i).
-
B.- Determinar el número y porcentaje de equipos de computación cuyas vidas útiles oscilan entre 700 y 1000 días.
-
C.- Encontrar los límites que sub-clasifiquen los equipos de computación en tres categorías, con referencia a su vida útil. CATEGORIA A: Rendimiento Óptimo (25 %superior) CATEGORIA B: Rendimiento Aceptable (el resto) CATEGORIA C: Rendimiento Pésimo (17 % inferior)
U N I V E R S I D A
D E
A Q U I N O 19
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
WORK PAPER # 2
PROGRAMA DE CONTROL DE CALIDAD
No. DE PROCEDIMIENTO: APRO 07
No. DE HOJAS: 4
ELABORÓ: Lic. ADM. Edgar Martínez Calderón
CÓDIGO:
TÍTULO DEL WORK PAPER: PROBABILIDADES PERMUTACIONES Y COMBINACIONES DPTO.: Facultad de Ciencias y Tecnología DESTINADO A: DOCENTES
ALUMNOS
X
ADMINIST.
OTROS
OBSERVACIONES: Ingeniería de Sistemas, Telecomunicaciones, Gas y Petróleo, Probabilidad y Estadística, Unidad II FECHA DE DIFUSIÓN:
FECHA DE ENTREGA:
U N I V E R S I D A
D E
A Q U I N O 20
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
PROBABILIDADES PERMUTACIONES Y COMBINACIONES PROBABILIDAD:
La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza un experimento. Ejemplo: Tiramos un dado al aire y queremos saber cual es la probabilidad de que salga un 2, o que salga un número par, o que salga un número menor que 4. El experimento tiene que ser aleatorio , es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones. Por lo tanto, a priori no se conoce cual de los resultados se va a presentar: Ejemplos: Se lanza una moneda al aire: el resultado puede ser cara o cruz, pero no sabemos de antemano cual de ellos va a salir. Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas de la probabilidad. Ejemplo: En lugar de tirar la moneda al aire, directamente seleccionamos la cara. Aquí no podemos hablar de probabilidades, sino que ha sido un resultado determinado por uno mismo. Antes de calcular las probabilidades de un experimento aleatorio hay que definir una serie de conceptos: Ejemplo: Al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6. Suceso compuesto: es un subconjunto de sucesos elementales. Ejemplo: Lanzamos un dado y queremos que salga un número par. El suceso "numero par" es un suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6 O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es un suceso compuesto formado por 18 sucesos elementales (todos los números que van del 1 al 18). Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral. Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las soluciones posibles). Ejemplo: Si tiramos una moneda al aíre una sola vez, el espacio muestral será cara o cruz. Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio muestral estaría formado por (cara-cara), (cara-cruz), (cruz-cara) y (cruz-cruz). PROBABILIDAD CONDICIONAL.
Las probabilidades condicionadas se calculan una vez que se ha incorporado información adicional a la situación de partida:
U N I V E R S I D A
D E
A Q U I N O 21
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Ejemplo: Se tira un dado y sabemos que la probabilidad de que salga un 2 es 1/6 (probabilidad a priori). Si incorporamos nueva información (por ejemplo, alguien nos dice que el resultado ha sido un número par) entonces la probabilidad de que el resultado sea el 2 ya no es 1/6. Las probabilidades condicionadas se calculan aplicando la siguiente fórmula:
Donde: P (B/A) es la probabilidad de que se de el suceso B condicionada a que se haya dado el suceso A. P (B ^ A) es la probabilidad del suceso simultáneo de A y de B P (A) es la probabilidad a priori del suceso A Según el ejemplo visto: P (B/A) es la probabilidad de que salga el número 2 (suceso B) condicionada a que haya salido un número par (suceso A). P (B ^ A) es la probabilidad de que salga el dos y número par. P (A) es la probabilidad a priori de que salga un número par. Por lo tanto: P (B L A) = 1/6 P (A) = 1/2 P (B/A) = (1/6) / (1/2) = 1/3 Luego, la probabilidad de que salga el número 2, si ya sabemos que ha salido un número par, es de 1/3 (mayor que su probabilidad a priori de 1/6). COMBINACIONES, VARIACIONES Y PERMUTACIONES
Para aplicar la Regla de Laplace, el cálculo de los sucesos favorables y de los sucesos posibles a veces no plantea ningún problema, ya que son un número reducido y se pueden calcular con facilidad: Ejemplo: Probabilidad de que al lanzar un dado salga el número 2. Tan sólo hay un caso favorable, mientras que los casos posibles son seis. Probabilidad de acertar al primer intento el horóscopo de una persona. Hay un caso favorable y 12 casos posibles. Sin embargo, a veces calcular el número de casos favorables y casos posibles es complejo y hay que aplicar reglas matemáticas:
U N I V E R S I D A
D E
A Q U I N O 22
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de que al menos los miembros de un matrimonio se sienten juntos. En este caso, determinar el número de casos favorables y de casos posibles es complejo. Las reglas matemáticas que nos pueden ayudar son el cálculo de combinaciones, el cálculo de variaciones y el cálculo de permutaciones. COMBINACIONES:
Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. Ejemplo: Calcular las posibles combinaciones de 2 elementos que se pueden formar con los números 1, 2 y 3. Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se cuentan una vez. VARIACIONES :
Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Ejemplo: Calcular las posibles variaciones de 2 elementos que se pueden establecer con los números 1, 2 y 3. Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos. PERMUTACIONES:
Calcular las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Por ejemplo, calcular las posibles formas en que se pueden ordenar los números 1, 2 y 3. Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1) CUESTIONARIO 1.- Considerando el lanzamiento de dos dados, calcular: A.- El espacio muestral asociado al experimento B.- La probabilidad de obtener suma mayor que 5 C.- La probabilidad de obtener el mismo número en ambos dados.
U N I V E R S I D A
D E
A Q U I N O 23
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
2.- La distribución de los estudiantes por carreras de UDABOL ORURO es la siguiente: CARRERAS
Nº TOTAL DE Nº DE ESTUDIANTES ESTUDIANTES MUJERES
DERECHO ING. COMERCIAL TURISMO ING. DE SISTEMAS ING. PETROLERA ING. TELECOMUNICACIONES
105 100 70 45 40 15
15 20 5 10 3 2
Cual la PROBABILIDAD de que el representante de los estudiantes de la universidad, seleccionado aleatoriamente: A.- Pertenezca a la carrera de Ingeniería Comercial B.- Sea una mujer C.- Sea un varón perteneciente a la carrera de Ingeniería de Sistemas 3.- Calcular las posibles formas en que se pueden ordenar los números 1, 2, 3 y 4.
U N I V E R S I D A
D E
A Q U I N O 24
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
WORK PAPER # 3
PROGRAMA DE CONTROL DE CALIDAD
No. DE PROCEDIMIENTO: APRO 07
No. DE HOJAS: 3
ELABORÓ: Lic. ADM. Edgar Martínez Calderón
CÓDIGO: MAT 113A
TÍTULO DEL WORK PAPER:
DISTRIBUCIONES DISCRETAS Y CONTINUAS
DPTO.: Facultad de Ciencias y Tecnología DESTINADO A: DOCENTES
ALUMNOS
X
ADMINIST.
OTROS
OBSERVACIONES: Ingeniería de Sistemas, Telecomunicaciones, Gas y Petróleo, Probabilidad y Estadística, Unidad II FECHA DE DIFUSIÓN:
FECHA DE ENTREGA:
U N I V E R S I D A
D E
A Q U I N O 25
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
DISTRIBUCIONES DISCRETAS Y CONTINUAS Las distribucion es discretas son aquellas en las que la variable puede pude tomar un número determinado de valores: Ejemplo: Si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32. Las distribuciones continuas son aquellas que presentan un número infinito de posibles soluciones: Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una población (72,5 años, 7,513 años, 72, 51234 años). Vamos a comenzar por estudiar las principales distribuciones discretas. DISTRIBUCIONES DISCRETAS: BERNOUILLI
Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas) Al haber únicamente dos soluciones se trata de sucesos comp lementarios: A la probabilidad de éxito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificándose que: p+q=1 Veamos los ejemplos anteriores: Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1 Ejemplo 3:
U N I V E R S I D A
D E
A Q U I N O 26
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + 0,99999 = 1 DISTRIBUCIONES DISCRETAS: BINOMIAL
La distribución binomial parte de la distribución de Bernouilli: La distribución de Bernouiili se aplica cuando se realiza una sola vez un experimento que tiene únicamente dos posibles resultados (éxito o fracaso), por lo que la variable sólo puede tomar dos valores: el 1 y el 0 La distribución binomial se aplica cuando se realizan un número"n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido éxitos Ejemplo: Se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10 La distribució n de probabilidad de este tipo de distribución sigue el siguiente modelo:
¿Alguien entiende esta fórmula? Vamos a tratar de explicarla con un ejemplo: Ejemplo 1: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? " k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decíamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6) " n" es el número de ensayos. En nuestro ejemplo son 10 " p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La fórmula quedaría:
Luego, P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces? " k " (número de aciertos) toma el valor 4 " n" toma el valor 8
U N I V E R S I D A
D E
A Q U I N O 27
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
" p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666) La fórmula queda:
Luego, P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar un dado 8 veces. CUESTIONARIO 1.- ¿Que es una distribución discreta? 2.- ¿Que es una distribución continua? 3.- ¿Cuál es la probabilidad de sacar 5 caras al lanzar una moneda 10 veces? 4.- ¿Cuál es la probabilidad de sacar 5 veces el número 3 al lanzar un dado 15 veces?
U N I V E R S I D A
D E
A Q U I N O 28
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
WORK PAPER # 4
PROGRAMA DE CONTROL DE CALIDAD
No. DE PROCEDIMIENTO: APRO 07
No. DE HOJAS: 3
ELABORÓ: Lic. ADM. Edgar Martínez Calderón
CÓDIGO: MAT 113A
TÍTULO DEL WORK PAPER:
MUESTREO
DPTO.: Facultad de Ciencias y Tecnología DESTINADO A: DOCENTES
ALUMNOS
X
ADMINIST.
OTROS
OBSERVACIONES: Ingeniería de Sistemas, Telecomunicaciones, Gas y Petróleo, Probabilidad y Estadística, Unidad III FECHA DE DIFUSIÓN:
FECHA DE ENTREGA:
U N I V E R S I D A
D E
A Q U I N O 29
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
MUESTREO Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad. MÉTODOS DE SELECCIÓN DE MUESTRAS.
Una muestra debe ser representativa si va a ser usada para estimar las características de la población. Los métodos para seleccionar una muestra representativa son numerosos, dependiendo del tiempo, dinero y habilidad disponibles para tomar una muestra y la naturaleza de los elementos individuales de la población. Por lo tanto, se requiere un gran volumen para incluir todos los tipos de métodos de muestreo. MÉTODOS DE SELECCIÓN DE MUESTRAS
Los métodos de selección de muestras pueden ser clasificados de acuerdo a: A.- El número de muestras tomadas de una población dada para un estudio y B.- La manera usada en seleccionar los elementos incluidos en la muestra. Los métodos de muestreo basados en los dos tipos de clasificaciones son expuestos en seguida. Los métodos de muestreo clasificados de acuerdo con el número de muestras tomadas de una población son: MUESTREO SIMPLE
Este tipo de muestreo toma solamente una muestra de una población dada para el propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser lo suficientemente grande para sacar una conclusión. Una muestra grande muchas veces cuesta demasiado dinero y tiempo. MUESTREO DOBLE
Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra no es decisivo, una segunda muestra es extraída de la misma población. Las dos muestras son combinadas para analizar los resultados. Este método permite a una persona principiar con una muestra relativamente pequeña para ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede no necesitarse. Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad intermedia, será requerirá la segunda muestra. Al probar la calidad de un lote consistente de 3,000 unidades manufacturadas, cuando el número de defectos encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es considerado bueno y es aceptado; si el número de defectos es 9 o más, el lote es considerado pobre y es rechazado; si el número está entre 5 y 9, no puede llegarse a una decisión y una segunda muestra de 80 unidades es extraída del lote. Si el número de defectos en las dos muestras combinadas (incluyendo 80 + 80 = 160 unidades) es 12 o menos, el lote es aceptado si el número combinado es 13 o más, el lote es rechazado. MUESTREO MÚLTIPLE
El procedimiento bajo este método es similar al expuesto en el muestreo doble, excepto que el número de muestras sucesivas requerido para llegar a una decisión es más de dos muestras.
U N I V E R S I D A
D E
A Q U I N O 30
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
MÉTODOS DE MUESTREO SEGÚN LAS MANERAS DE SELECCIONAR
Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes: A.- Basados en el juicio de una persona. B.- Selección aleatoria (al azar) MUESTREO DE JUICIO
Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados mediante juicio personal. La persona que selecciona los elementos de la muestra, usualmente es un experto en la medida dada. Una muestra de juicio es llamada una muestra probabilística, puesto que este método está basado en los puntos de vista subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para medir el error de muestreo, Las principales ventajas de una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es bajo. MUESTREO ALEATORIO
Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático, muestreo estratificado y muestreo de conglomerados. A.- MUESTREO ALEATORIO SIMPLE
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población. Para obtener una muestra aleatoria simple, cada elemento en la población tenga la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por una tabla de números aleatorios. Cuando una población es infinita, es obvio que la tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de numerar cada elemento de la población es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes de muestreo aleatorio modificado son sistemáticos, estratificados y de conglomerados. B.- MUESTREO SISTEMÁTICO .
Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población es, primero, dividido por el número deseado en la muestra. El cociente indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la población, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar.
U N I V E R S I D A
D E
A Q U I N O 31
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
C.- MUESTREO ESTRATIFICADO
Para obtener una muestra aleatoria estratificada, primero se divide la población en grupos, llamados estratos, que son más homogéneos que la población como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método sistemático de cada estrato. Las estimaciones de la población, basadas en la muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que si la población entera muestreada mediante muestreo aleatorio simple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporcional al tamaño del estrato en relación con la población. D.- MUESTREO DE CONGLOMERADOS.
Para obtener una muestra de conglomerados, primero dividir la población en grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos o parte de ellos al azar o por un método sistemático de los grupos seleccionados para obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria. Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada “conglomerado” tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir en otra área. No todas las áreas son muestreadas en un muestreo de áreas. La variación entre los elementos obtenidos de las áreas seleccionadas es, por lo tanto, frecuentemente mayor que la obtenida si la población entera es muestreada mediante muestreo aleatorio simple. Esta debilidad puede reducida cuando se incrementa el tamaño de la muestra de área. El incremento del tamaño de la muestra puede fácilmente ser hecho en muestra muestra de área. Los entrevistadores no tienen que caminar demasiado lejos en una pequeña área para entrevistar más familias. Por lo tanto, una muestra grande de área puede ser obtenida dentro de un corto período de tiempo y a bajo costo. Por otra parte, una muestra de conglomerados puede producir la misma precisión en la estimación que una muestra aleatoria simple, si la variación de los elementos individuales dentro de cada conglomerado es tan grande como la de la población. CUESTIONARIO 1.- Realice la definición de muestreo y cite un ejemplo 2.- ¿Cuales son los métodos de muestreo según las maneras de seleccionar? 3.- ¿Cuál es la diferencia entre el muestreo estratificado y el muestreo por conglomerados? 4.- Desarrolle un ejemplo práctico donde pueda aplicar uno de los tipos de muestreo vistos en el documento.
U N I V E R S I D A
D E
A Q U I N O 32
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
WORK PAPER # 5
PROGRAMA DE CONTROL DE CALIDAD
No. DE PROCEDIMIENTO: APRO 07
No. DE HOJAS: 3
ELABORÓ: Lic. ADM. Edgar Martínez Calderón
CÓDIGO: MAT 113A
TÍTULO DEL WORK PAPER: REGRESIÓN LINEAL DPTO.: Facultad de Ciencias y Tecnología DESTINADO A: DOCENTES
ALUMNOS
X
ADMINIST.
OTROS
OBSERVACIONES: Ingeniería de Sistemas, Telecomunicaciones, Gas y Petróleo, Probabilidad y Estadística, Unidad III FECHA DE DIFUSIÓN:
FECHA DE ENTREGA:
U N I V E R S I D A
D E
A Q U I N O 33
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
REGRESIÓN Y CORRELACIÓN INTRODUCCION
Si sobre una población de niños entre 0 y 6 años, estudiamos las variables peso y estatura, esperamos que en general ocurra que a mayor estatura también encontremos mayor peso, aunque es posible que en algunos pocos casos no ocurra así. Se observa que existe una relación entre las dos variables, aunque no es funcional, o sea, no puedo determinar con exactitud el peso que corresponderá a cada talla. Este WP tratara de describir y medir este tipo de relaciones, que aparecen en gran cantidad de problemas. DISTRIBUCIONES BIDIMENCIONALES
Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional. EJEMPLO 1
Las notas de 10 alumnos en Matemáticas y en Lenguaje vienen dadas en la siguiente tabla: MATEMÁTICAS
2
4
5
5
6
6
7
7
8
9
LENGUAJE
2
2
5
6
5
7
5
8
7
10
Los pares de valores {(2,2),(4,2),(5,5),...;(8,7),(9,10)}, forman la distribución bidimensional. IDEA DE CORRELACION
Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas. En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en Matemáticas, mejor es la de lenguaje. NUBE DE PUNTOS O DIGRAMA DE DISPERSIÓN
La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
U N I V E R S I D A
D E
A Q U I N O 34
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
CORRELACION LINEAL Y RECTA DE REGRESIÓN
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Se dice correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta. En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube. Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir. EJEMPLO 2
Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados. Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).
U N I V E R S I D A
D E
A Q U I N O 35
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
EJEMPLO 3
A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla: Distancia (en Km.) 0,05 0,1 0,12 0,4 0,5 0,7 1 1,2 2,1 2,5 3 Nota media
8,4
4
3
5,7 9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlación es prácticamente inexistente, es decir, no tiene nada que ver con el rendimiento académico la distancia del domicilio al instituto, MEDIDA DE LA CORRELACION
La apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa. El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo. Antes de ponernos a trabajar destacaremos una de sus propiedades
-1 < r < 1 Este coeficiente nos informa del grado de relación entre dos variables. Si la relación es lineal perfecta, r será 1 ó -1. El coeficiente r será positivo si la relación es positiva (al aumentar x aumenta y), y r será negativo en el caso contrario (si al aumentar x, disminuye y).
U N I V E R S I D A
D E
A Q U I N O 36
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
CUESTIONARIO 1.- ¿Qué es la correlación? 2.- Cual es la utilidad del diagrama de dispersión 3.- Explique sobre la medida de correlación 4.- La siguiente tabla representan los usuarios de Internet en Bolivia. Se pide regresionar mencionados datos para los años 2010, 2011, 2012, 2013, 2014, 2015 y 2016
AÑO
NÚMERO DE USUARIOS
2002 2003 2004 2005 2006 2007 2008 2009
46400 54060 58040 55900 58500 64300 67950 69300
U N I V E R S I D A
D E
A Q U I N O 37
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
PROGRAMA DE CALIDAD UDABOL DIF – 001 GENERALIDADES Y ANTECEDENTES HISTÓRICOS DE LA ESTADÍSTICA INTRODUCCIÓN.
Estadística, rama de las matemáticas que se ocupa de reunir, organizar y analizar datos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones. Ante todo es un elemento útil, ya que nos permite obtener información referida a grandes grupos de individuos conociendo los datos de sólo unos pocos. Estadística deriva del vocablo “estado” RAMAS: Estadística descriptiva
=
Calculo de probabilidades
=
Recogida, clasificación, presentación de datos. Es un método deductivo Razonamiento matemático. Es un método deductivo
Inferencia estadística
=
Trabaja a partir del cálculo de probabilidades. Método inductivo
ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA Definición del objetivo
Recogida de datos
Censo = Toda la población Encuesta = Parte de la población (muestra)
Descripción y estimación de los parámetros poblacionales
ESTADÍSTICA DESCRIPTIVA - Historia •
• • •
• •
Herodoto (485-425 a de JC) relata que ya en Egipto (3050 a de JC) se elaboró un censo de población y riqueza Se tienen noticias de que lo mismo hicieron los chinos Grecia y Roma efectuaron recuentos periódicos sobre riqueza con fines tributarios Edad Media = No se tienen noticias sobre operaciones estadísticas mas que sobre los bienes de la Iglesia s. XVI = Nace la escuela mercantilista francesa con Colbert, Bufón y Condorcet De ella nacen la escuela Inglesa con Graunt, Petty, Halley, Davenant y King y la Alemana con Seckendorf, Coring y Achenwall
U N I V E R S I D A
D E
A Q U I N O 38
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
• • •
s. XVII (mediados) = Graunt Destaca por sus estudios demográficos s XVII (finales) = Petty efectúa estudios sobre demografía, Renta y Tráfico Mercantil s. XVIII y XIX = Se produce un gran crecimiento de la estadística descriptiva y se elaboran los primeros censos oficiales (1790 USA)
EL CÁLCULO DE PROBABILIDADES.
Es la rama de las matemáticas que se basa en el razonamiento deductivo • •
•
•
S. XVI = S. XVII =
Cardano (1501 – 1576) y Galileo (1564 – 1642) son pioneros en esta rama Pascal (1623 – 1622) y Pierre de FermaT (1601 – 1665) comienzan con la formalización del cálculo de probabilidades sobre los juegos de azar propuesto por un jugador (Meré) Huygens recopila los trabajos de los anteriores y aparece la sistematización el Cálculo de probabilidades (1669)
S. XVIII y XIX = Movidos por el intento de la contrastación empírica sobre astronomía y Física, destacaron Jacobo y Damiel Bernouilli, Abraham de Moivre, Laplace, Gauss, Poisson y Chebychev S. XX =
Autores clásicos de la escuela rusa son Markov, Liapounoff y Kolmogoroff De la escuela francesa destacaron Borel, Levy, Lebesgue y Fréchet
LA INFERENCIA ESTADÍSTICA. • •
Arranca EN el s. XVIII con Laplace y Gauss Tres corrientes = La escuela Inglesa Inferencia Bayesiana Teoría de la decisión
• •
•
•
La escuela Inglesa destaca por sus estudios biológicos = Pearson, Gosset, Fisher y Neyman Influencia Bayesiana = Nace a partir del sacerdote Thomas Bayes (Teorema de Bayes) Le siguen Ramsey, Bruno de Finetti y Savage con la Probabilidad subjetiva Teoría de la Decisión =
De Wald, aprovecha la influencia Bayesiana y aporta el concepto de Función de pérdida Sociedad de Econometría = Fundada por Irwing Fisher, junto con Roos y Frish en 1930 aplican los conocimientos de inferencia estadística sobre física, astronomía y ciencias naturales a la Economía.
U N I V E R S I D A
D E
A Q U I N O 39
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
ETAPA DE SISTEMATIZACIÓN DE LA ESTADISTICA.
Se caracteriza por la aparición de escuelas que sistematizaron la Estadística. Destacándose tres: LA ESCUELA ALEMANA.Creó la primera cátedra de Estadística, considerando esta disciplina como la descripción de los fenómenos concernientes al Estado o Administración. LA ESCUELA INGLESA.Cuantificaron las leyes que rigen los fenómenos sociales, como consecuencia. “aritmetizaron” la Estadística. LA ESCUELA FRANCESA.Introduce la teoría de las probabilidades como fundamento matemático de la Estadística. PARA QUE SIRVE LA ESTADÍSTICA.
La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reducción de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla. LA ESTADÍSTICA RESPONDE A LAS NECESIDADES BÉLICAS Y FISCALES DE LOS GOBERNANTES. Esto se puede conseguir con un conocimiento claro de la población con la que se cuenta. La herramienta para conseguirlo es el CENSO DE POBLACIÓN y su hermano pequeño, el PADRÓN MUNICIPAL DE HABITANTES. La práctica del recuento de la población y de algunas características de esta por los Estados es muy antigua (se remonta a 3000 años antes de Cristo en Egipto y Mesopotamia). En palabras de Bielfed, la Estadística es la ciencia que nos enseña el ordenamiento político de todos los estados del mundo conocido, es decir, está al servicio del Estado, de hecho, la palabra Estadística deriva de Estado. LA ESTADÍSTICA RESPONDE A LA ACTIVIDAD PLANIFICADORA DE LA SOCIEDAD. Con la Revolución Industrial aparecen nuevos problemas, sobre todo de desigualdades sociales. La Estadística es un instrumento para identificar estas injusticias y para producir información en el llamado Estado del Bienestar. LA ESTADÍSTICA RESPONDE A NUEVAS DEMANDAS SOCIALES . Para realizar investigaciones exhaustivas sobre temas sociales surgen tres problemas básicos a la hora del trabajo de campo, como el tiempo que tardaríamos en entrevistar a toda la población y el costo económico y de personal de estas entrevistas. Con las técnicas de MUESTREO se consigue hacer buenas investigaciones sobre una pequeña parte de esa población, obteniendo resultados válidos para toda ella. LA ESTADÍSTICA RESPONDE A LAS NECESIDADES DEL DESARROLLO CIENTÍFICO Y TECNOLÓGICO DE LA SOCIEDAD. Tras la Revolución Industrial se produce un desarrollo de la sociedad en todos sus ámbitos y, en particular, en el Científico y Tecnológico. Las Comunicaciones, la Industria, la Agricultura, la Salud... se desarrollan rápidamente y se exige el máximo rendimiento y la mejor utilización de estos sectores.
U N I V E R S I D A
D E
A Q U I N O 40
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Las técnicas de INVESTIGACIÓN DE MERCADOS permiten saber si un producto cualquiera será bien acogido en el mercado antes de su salida a este, o bien medir la audiencia en Televisión y Radio. El CONTROL DE CALIDAD permite medir las características de la calidad de un producto, compararlas con ciertos requisitos y tomar decisiones correctivas si hay diferencias entre el funcionamiento real y el esperado. Con estudios estadísticos aplicados a la Agricultura y a la Pesca podemos estimar los rendimientos obtenidos en una cosecha, o encontrar bancos de peces. En MEDICINA E INVESTIGACIÓN farmacológica es imprescindible la Estadística, probando nuevos tratamientos en grupos de pacientes o bien, obteniendo conclusiones sobre ciertas enfermedades observando durante un tiempo un grupo de pacientes (saber si para el tratamiento de cierto tipo de cáncer es más efectiva la cirugía, la radioterapia o la quimioterapia, sin más que observar un grupo de pacientes tratados con estas técnicas). Con el estudio de los PROCESOS ESTOCÁSTICOS se puede tener una mejor comprensión de fenómenos de comportamiento aleatorio como meteorología, física nuclear, campañas de seguridad.
U N I V E R S I D A
D E
A Q U I N O 41
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
PROGRAMA DE CALIDAD UDABOL DIF – 002 INTRODUCCIÓN A LA ESTADÍSTICA DEFINICIÓN DE ESTADÍSTICA.
La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadística interviene cuando se quiere conocer el estado sanitario de un país, a través de ciertos parámetros como la tasa de morbilidad o mortalidad de la población. En este caso la estadística describe la muestra en términos de datos organizados y resumidos, y luego infiere conclusiones respecto de la población. POBLACIÓN Y MUESTRA.
Puesto que la estadística se ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se llama población. No debe confundirse la población en sentido demográfico y la población en sentido estadístico. La población en sentido demográfico es un conjunto de individuos (todos los habitantes de un país, todas las ratas de una ciudad), mientras que una población en sentido estadístico es un conjunto de datos referidos a determinada característica o atributo de los individuos (las edades de todos los individuos de un país, el color de todas las ratas de una ciudad). Incluso una población en sentido estadístico no tiene porqué referirse a muchos individuos. Una población estadística puede ser también el conjunto de calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios. Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin embargo, en la mayoría de los casos no es posible obtenerlos por razones de esfuerzo, tiempo y dinero, razón por la cual se extrae, de la población, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra a un subconjunto de la población, preferiblemente representativo de la misma. Por ejemplo, si la población es el conjunto de todas las edades de los estudiantes de la ciudad de Oruro, una muestra será el conjunto de edades de 2000 estudiantes de la ciudad de Oruro tomados al azar. DATOS INDIVIDUALES Y DATOS ESTADÍSTICOS.
Un dato individual es un dato de un solo individuo, mientras que un dato estadístico es un dato de una muestra o de una población en su conjunto. Por ejemplo, la edad de Juan es un dato individual, mientras que el promedio de edades de una muestra o población de personas es un dato estadístico.
U N I V E R S I D A
D E
A Q U I N O 42
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Desde ya, puede ocurrir que ambos no coincidan: la edad de Rubén puede ser 37 años, y el promedio de edades de la muestra donde está incluido Rubén es 23 años. Por esta razón un dato estadístico nada dice respecto de los individuos, porque solamente describe la muestra o población. Los datos estadísticos que describen una muestra suelen llamarse estadísticos o estadígrafos (por ejemplo, el promedio de ingresos mensuales de las personas de una muestra), mientras que los datos estadísticos descriptores de una población suelen llamarse parámetros (por ejemplo, el promedio de ingresos mensuales de las personas de una población). ESTRUCTURA DEL DATO.
Los datos son la materia prima con que trabaja la estadística, del mismo modo que la madera es la materia prima con que trabaja el carpintero. Así como este procesa o transforma la madera para obtener un producto útil, así también el estadístico procesa o transforma los datos para obtener información útil. Tanto los datos como la madera no se inventan: se extraen de la realidad; en todo caso el secreto está en recoger la madera o los datos más adecuados a los objetivos del trabajo a realizar. De una manera general, puede definirse técnicamente dato como una categoría asignada a una variable de una unidad de análisis. Por ejemplo, “Raúl tiene 1.60 metros de estatura” es un dato, donde ‘Raúl’ es la unidad de análisis, ‘estatura’ es la variable, y ‘1.60 metros’ es la categoría asignada. Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de análisis, una variable y una categoría. La UNIDAD DE ANÁLISIS es el elemento del cual se predica una propiedad y característica. Puede ser una persona, una familia, un animal, una sustancia química, o un objeto como una dentadura o una mesa. La VARIABLE es la característica, propiedad o atributo que se predica de la unidad de análisis. Por ejemplo puede ser la edad para una persona, el grado de cohesión para una familia, el nivel de aprendizaje alcanzado para un animal, el peso específico para una sustancia química, el nivel de ‘salud’ para una dentadura, y el tamaño para una mesa. Pueden entonces también definirse población estadística (o simplemente población) como el conjunto de datos acerca de unidades de análisis (individuos, objetos) en relación a una misma característica, propiedad o atributo (variable). Sobre una misma población demográfica pueden definirse varias poblaciones de datos, una para cada variable. Por ejemplo, en el conjunto de habitantes de un país (población demográfica), puede definirse una población referida a la variable edad (el conjunto de edades de los habitantes), a la variable ocupación (el conjunto de ocupaciones de los habitantes), a la variable sexo (el conjunto de condiciones de sexo de los habitantes). La CATEGORÍA es cada una de las posibles variaciones de una variable. Categorías de la variable sexo son masculino y femenino, de la variable ocupación pueden ser arquitecto, médico, etc, y de la variable edad pueden ser 10 años, 11 años, etc.
U N I V E R S I D A
D E
A Q U I N O 43
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Cuando la variable se mide cuantitativamente, es decir cuando se expresa numéricamente, a la categoría suele llamársela valor. En estos casos, el dato incluye también una unidad de medida, como por ejemplo años, cantidad de hijos, grados de temperatura, cantidad de piezas dentarias, centímetros, etc. El valor es, entonces, cada una de las posibles variaciones de una variable cuantitativa. LA MEDICIÓN.
Los datos se obtienen a través un proceso llamado medición. Desde este punto de vista, puede definirse medición como el proceso por el cual asignamos una categoría (o un valor) a una variable, para determinada unidad de análisis. Ejemplo: cuando decimos que Martín es varón, estamos haciendo una medición, porque estamos asignando una categoría (varón) a una variable (sexo) para una unidad de análisis (Luis). Se pueden hacer mediciones con mayor o menor grado de precisión. Cuanto más precisa sea la medición, más información nos suministra sobre la variable y, por tanto, sobre la unidad de análisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros. Los diferentes grados de precisión o de contenido informativo de una medición se suelen caracterizar como niveles de medición. Típicamente se definen cuatro niveles de medición, y en cada uno de ellos la obtención del dato o resultado de la medición será diferente: Ejemplos de datos en diferentes niveles de medición
Nivel de medición
Nivel nominal
DATO
Luis es electricista
Unidad de análisis
Luis
Variable
Oficio
Categoría o valor
Electricista
Unidad de medida
-------------
Nivel ordinal
Nivel cuantitativo discreto
Elena terminó Juan tiene 32 dientes la secundaria Elena Nivel de instrucción Secundaria completa ------------
Nivel cuantitativo continuo María tiene 70 pulsaciones por minuto
Juan
María
Cantidad de piezas dentarias
Frecuencia cardiaca
32
70
Diente
Pulsaciones por minuto
En el nivel nominal, medir significa simplemente asignar un atributo a una unidad de análisis (Luis es electricista). En el nivel ordinal, medir significa asignar un atributo a una unidad de análisis cuyas categorías pueden ser ordenadas en una serie creciente o decreciente (la categoría ‘secundaria completa’ puede ordenarse en una serie, pues está entre ‘secundaria incompleta’ y ‘universitaria incompleta’). En el nivel cuantitativo, medir significa además asignar un atributo a una unidad de análisis de modo tal que la categoría asignada permita saber ‘cuánto’ mayor o menor es respecto de otra categoría,
U N I V E R S I D A
D E
A Q U I N O 44
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
es decir, especifica la distancia o intervalo entre categorías (la categoría 70 es el doble de la categoría 35).Las variables medibles en el nivel cuantitativo pueden ser discretas o continuas. Una variable discreta es aquella en la cual, dados dos valores consecutivos, no puede adoptar ningún valor intermedio (por ejemplo entre 32 y 33 dientes, no puede hablarse de 32.5 dientes). En cambio, una variable es continua cuando, dados dos valores consecutivos, la variable puede adoptar muchos valores intermedios (por ejemplo entre 1 y 2 metros, puede haber muchas longitudes posibles). CLASIFICACIONES DE LA ESTADÍSTICA.
Existen varias formas de clasificar los estudios estadísticos. SEGÚN LA ETAPA.- Hay una estadística descriptiva y una estadística inferencial. La primera etapa se ocupa de describir la muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen la muestra (por ejemplo con respecto a la población). SEGÚN EL TIEMPO CONSIDERADO.- Dentro de la estadística descriptiva se distingue la estadística estática o estructural, que describe la población en un momento dado (por ejemplo la tasa de nacimientos en determinado censo), y la estadística dinámica o evolutiva, que describe como va cambiando la población en el tiempo (por ejemplo el aumento anual en la tasa de nacimientos). SEGÚN LA CANTIDAD DE VARIABLES ESTUDIADA.- Desde este punto de vista hay una estadística univariada (estudia una sola variable, como por ejemplo la inteligencia, en una muestra), una estadística bivariada (estudia como están relacionadas dos variables, como por ejemplo inteligencia y alimentación), y una estadística multivariada (que estudia tres o más variables, como por ejemplo como están relacionados el sexo, la edad y la alimentación con la inteligencia).
U N I V E R S I D A
D E
A Q U I N O 45
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
PROGRAMA DE CALIDAD UDABOL DIF – 003 MEDIDAS DE DISTRIBUCIÓN - ASIMETRÍA Y CURTOSIS Las medidas de distribución nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y laCurtosis. ASIMETRÍA Esta medida permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres estados diferentes [Fig.1], cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Figura 1
El Coeficiente de asimetría, se representa mediante la ecuación matemática,
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuación se interpretan: −
−
−
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5). (g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la parte derecha de la media.
U N I V E R S I D A
D E
A Q U I N O 46
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la distancia que separa la aglomeración de los valores con respecto a la media. CURTOSIS Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
Figura 2
Para calcular el coeficiente de Curtosis se utiliza la ecuación:
Donde (g2) representa el coeficiente de Curtosis, (X i) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta fórmula se interpretan: −
− −
(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante difícil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos (± 0.5 aprox.). (g2 > 0) la distribución es Leptocúrtica (g2 < 0) la distribución es Platicúrtica
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g 1 = ±0.5) y un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayoría de los procedimientos de la estadística de inferencia se requiere que los datos se distribuyan normalmente. La principal ventaja de la distribución normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estándar de la media aritmética (Fig.3); es decir, si tomamos la media y le sumamos dos veces la desviación y después le restamos a la media dos desviaciones, el 95% de los casos se encontraría dentro del rango que compongan estos valores.
U N I V E R S I D A
D E
A Q U I N O 47
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Figura 3
PROGRAMA DE CALIDAD UDABOL DIF – 004 INTRODUCCIÓN A LAS DISTRIBUCIONES DE PROBABILIDAD Las distribuciones de probabilidad están relacionadas con las distribuciones de frecuencias. Una distribución de frecuencias teórica es una distribución de probabilidades que describe la forma en que se espera que varíen los resultados. Debido a que estas distribuciones tratan sobre expectativas de que algo suceda, resultan ser modelos útiles para hacer inferencias y para tomar decisiones en condiciones de incertidumbre. Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que se presentaron realmente cuando se efectuó el experimento, mientras que una distribución de probabilidad es un listado de las probabilidades de todos los posibles resultados que podrían obtenerse si el experimento se lleva a cabo. Las distribuciones de probabilidad pueden basarse en consideraciones teóricas o en una estimación subjetiva de la posibilidad. Se pueden basar también en la experiencia. TIPOS DE DISTRIBUCIONES DE PROBABILIDAD.
Las distribuciones de probabilidad se clasifican como continuas y discretas. En la distribución de probabilidad discreta está permitido tomar sólo un número limitado de valores. En una distribución de probabilidad continua, la variable que se está considerando puede tomar cualquier valor dentro de un intervalo dado. Las distribuciones continuas son una forma conveniente de presentar distribuciones discretas que tienen muchos resultados posibles, todos muy cercanos entre sí. VARIABLES ALEATORIAS.
Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Puede ser discreta o continua. Si puede tomar sólo un número limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, si puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua. Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una presentación a otra, sin seguir una secuencia predecible. Los valores de una variable aleatoria son los valores numéricos correspondientes a cada posible resultado de un experimento aleatorio. La distribución de probabilidad de una variable aleatoria proporciona una probabilidad para cada valor posible, y estas probabilidades deben sumar 1. VALOR ESPERADO DE UNA VARIABLE ALEATORIA.
El valor esperado es una idea fundamental en el estudio de las distribuciones de probabilidad.
U N I V E R S I D A
D E
A Q U I N O 48
B O L I V I A
FACULTAD DE CIENCIAS Y TECNOLOGÍA
Para obtener el valor esperado de una variable aleatoria discreta, se multiplica cada valor que la variable puede tomar por la probabilidad de presentación de ese valor y luego se suman esos productos. Es un promedio pesado de los resultados que se esperan en el futuro. El valor esperado pesa cada resultado posible con respecto a la frecuencia con que se espera se que presente. En consecuencia, las presentaciones más comunes tienen asignadas un peso mayor que las menos comunes. El valor esperado también puede ser obtenido a partir de estimaciones subjetivas. En ese caso, el valor esperado no es más que la representación de las convicciones personales acerca del resultado posible. En muchas situaciones, encontraremos que es más conveniente, en términos de los cálculos que se deben hacer, representar la distribución de probabilidad de una variable aleatoria de una manera algebraica. Al hacer esto, podemos llevar a cabo cálculos de probabilidad mediante la sustitución de valores numéricos directamente en una fórmula algebraica. El valor esperado de una variable aleatoria discreta es un promedio pesado del valor de cada resultado posible multiplicado por la probabilidad de dicho resultado. Aunque existen muchos valores diferentes posibles que la variable aleatoria puede tomar, el valor esperado es sólo un número.
U N I V E R S I D A
D E
A Q U I N O 49
B O L I V I A