ESTADÍSTICA APLICADA A LA COMUNICACIÓN
Prof. Judith Alvarado
Contenido Contenido..................................................... ............................................................................................................. .................................................................................. ................................. ............ .....2 ESTADÍSTICA...................................................... .............................................................................................................. ............................................................................ ........................... .........4 CONCEPTO Y GENERALIDADES:........................................................ ................................................................................ ................................ ............... ........... .... 4 UNIDAD Y DATO ESTADÍSTICO........................................................ ..................................................................................... ..................................... ............... .........5 POBLACIÓN, UNIVERSO, MUESTRA, VARIABLE................................................. VARIABLE........................................................ .............. ............... ........ 5 DIVISIÓN DE LOS MÉTODOS ESTADÍSTICOS. ESTADÍSTICOS.............................................................................. .............................................................................55 ESTADÍSTICA DESCRIPTIVA SIMPLE..................................................... ......................................................................................... ....................................... ...66 ESTADÍSTICA INDUCTIVA................................................... ......................................................................................................... ............................................................ ......77 ESTADÍSTICA DE RELACIONES O COMPLEJA (DESCRIPTIVA O INDUCTIVA)................... INDUCTIVA)...................77 INVESTIGACIÓN ESTADÍSTICA. .......................................................................................................8 .......................................................................................................8 DIFERENTES FORMAS DE INVESTIGACIÓN................................................................................ INVESTIGACIÓN................................................................................88 INVESTIGACIÓN DIRECTA:...................................................... ............................................................................................ .............................................. ............... ...........8 INVESTIGACIONES INDIRECTAS................................................................................................... INDIRECTAS................................................................................................... 8 PASOS EN EL PLANTEAMIENTO Y EJECUCIÓN DE UNA INVESTIGACIÓN....... .............. ............ ......... ....10 10 ESTADÍSTICA.................................................. ESTADÍSTICA. ......................................................................................................... .......................................................................... .......................... ........ 10 1.- FORMULACIÓN DEL PROBLEMA ESPECÍFICO DE LA INVESTIGACIÓN. INVESTIGACIÓN................... ..................11 11 2.- DESARROLLO DE UN MÉTODO PARA LA OBTENCIÓN DE LOS DATOS................... DATOS...................11 11 3.- RECOLECCIÓN DE LOS DATOS........................................................................................... DATOS........................................................................................... 11 4.- CLASIFICACIÓN DE LOS DATOS......................................................................................... DATOS.........................................................................................12 12 5.- ANÁLISIS ESTADÍSTICO...................................................... ESTADÍSTICO................................................................................. .................................. ............... ............... ....... 12 6.- PRESENTACIÓN DE LOS RESULTADOS................................................ RESULTADOS....................................................... .............. ............... .............. ...... 12 7.- INTERPRETACIÓN DE LOS RESULTADOS................................................. RESULTADOS........................................................ .............. ............... ..........13 FUENTES Y RECOLECCIÓN DE DATOS........................................................................................... DATOS...........................................................................................13 13 FUENTES DE DATOS................................................... DATOS............................................................................................ ................................................ ............... ............... ............ ..... 13 MÉTODOS DE RECOLECCIÓN DE DATOS................................................. .............................................................. .................... ............... ............. ..... 13 EL CUESTIONARIO:.................................................. ...................................................................................................... ........................................................... ............... ............ ....15 15 Ejemplo de cuestionario...................................................... ............................................................................................................. .............................................................. .......... ...17 17 Recolección Real de los Datos ................................................... .................................................................................................... ........................................................ ...........18 18 MEDIDAS DE TENDENCIA CENTRAL............................................... ....................................................................................... ............................................... .......18 18 PROCEDIMIENTO PARA SU CÁLCULO: ...................................................... ..................................................................... ...................... .............. .......... ...19 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS ................................................. ............................................................. .................... ............. .....19 19 Tengamos claro algunas definiciones importantes:.................................................... ............................................................ ............... .............. .......... ...20 Número de clases, número de grupo o número de filas con los que contará la tabla......... tabla................ ............. .......... .... 21 Pasos para la elaboración de la tabla de frecuencias..................................................... ......................................................................... ....................... ...22 22 PASO Nº 1................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 22 PASO Nº 2................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 22 PASO Nº 3................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 23 PASO Nº 4................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 23 PASO Nº 5................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 23 PASO Nº 6 ............................................................................................................... ............................................................................ .......................................... .............. ............... ..........23 PASO Nº 7................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 23 PASO Nº 8................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 24 PASO Nº 9................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 24 CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL EN DATOS AGRUPADOS......... AGRUPADOS.........25 25 CÁLCULO DE LA MODA ...................................................... ................................................................................................ .................................................. ............ .... 25 ESTADÍSTICA: PROF. JUDITH ALVARADO
2
PASO Nº 1................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 25 PASO Nº 2................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 25 PASO Nº 3................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 26 PASO Nº 4................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 26 PASO Nº 5................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 26 CÁLCULO DE LA MEDIANA: .................................................... ........................................................................................ ........................................... .............. .......... ...26 PASO Nº 1................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 26 PASO Nº 2................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 27 PASO Nº 3................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 27 PASO Nº 4................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 27 PASO Nº 5................................................. ......................................................................................................... .................................................................. .................. ............... ............ ..... 27 CÁLCULO DE LA MEDIA................................................ ................................................................................................. ........................................................ .............. .........27 27 Glosario: ..........................................................................................................................................27 ..........................................................................................................................................27 MEDIDAS DE DISPERSIÓN.................................................... .................................................................................................. ..................................................... ............... ........ 28 Concepto de desviación:................................................ ............................................................................................ .................................................... ............... .............. ........... .... 28 Desviación media:..................................................... ............................................................................................................. ....................................................................... ................... ....28 28 Varianza o desviación cuadrática media: ..................................................... ..................................................................................... ....................................... .........29 29 Desviación típica o estándar:................................................... ....................................................................................... ........................................... .............. ............... ............29 Medidas de Dispersión ( en datos agrupados )................................................... ..................................................................................... ..................................29 29 MEDIDAS DE POSICIÓN..................................................... ............................................................................................................. ................................................................. .........32 32 CUANTILES:....................................................... ............................................................................................................ ............................................................ ............... ............... ........... .... 32 Cuartiles: .............................................................................................. ........................... .................................. ............... ..........32 Deciles:..................................................... ............................................................................................................. ........................................................................................ ................................32 32 Percentiles:..................................................... ............................................................................................................ ........................................................................ ........................ .......... ...32 32 INTERPRETACIÓN DE MEDIDAS DE POSICIÓN POSICIÓN.................................................... ........................................................... ............... ............ ....34 34 CÁLCULO DE LOS CUARTILES O PERCENTILES .............................................................................................................................................................. 35 TEORÍA DE PROBABILIDAD........................................................ .................................................................................................. .................................................. ............ .... 35 Espacio muestral:................................................. ........................................................................................................ .................................................................. ................... .............. ...... 36 EXÁMENES DEL PRIMER CORTE................................................ .................................................................................... ............................................ ............... ...........38 38
ESTADÍSTICA: PROF. JUDITH ALVARADO
3
ESTADÍSTICA CONCEPTO Y GENERALIDADES: Se ha definido la Estadística de varias formas: - " Técnica especial apta para el estudio cuantitativo de los fenómenos de masas o colectivos, entendiendo por tales, aquellos fenómenos naturales, económicos soci social ales es,, etc. etc.,, cuya cuya medi medici ción ón requ requie iere re una una masa masa de obse observa rvaci cion ones es de otro otros s fenómenos más simples llamados individuales o particulares" Conrado Gini. - "Ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de un fenómeno." Udny Yule. La Estadística no es una ciencia sino un conjunto de métodos, que en lo sucesivo llamaremos métodos estadísticos. Los métodos estadísticos deben su importancia al gran campo de aplicación que pose posee en; no exi existe sten cie cienci ncias cuyo cuyos s fenó fenóm menos enos no pued puedan an ser ser trat tratad ados os estadísticamente; es por ello que se llama a la Estadística el lenguaje científico. Los fenómenos que pueden ser tratados por el método estadístico se pueden dividir en tres grandes grupos, a saber: a) Fenómenos Fenómenos que que pueden pueden ser estudiad estudiados os a través través de la simple simple observac observación, ión, lo lo cual puede ser debido a las siguientes razones: 1.- Que el número de casos se deba estudiar sea muy grande y por ello incapaz de fijarse cuantitativamente a través de la mera observación; 2.- Porque sucedan dentro de intervalos de tiempo muy grande, lo que no permite a nuestra memoria retenerlos y 3.- Que los fenómenos se presenten con frecuencia o intensidades diferentes haciendo imposible su enumeración sin la aplicación de los métodos estadísticos. b) Fenó Fenóme meno nos s que deba deban n ser estu estudi diado ados s no sólo sólo desde desde el pun punto to de vista vista cuantitativo, como el caso de las investigaciones socioeconómicas, socioeconómicas, que relacionan en un sujeto su instrucción, inclinación artística, etc., con el monto de su salario, número de hijos, etc. c) Fenóme Fenómenos nos que que se pueden pueden estu estudia diarr cuantit cuantitati ativam vament ente e sin neces necesida idad d del méto método do esta estadí díst stic ico, o, pero pero en dich dicho o estu estudi dio o se come comete ten n cier cierto tos s erro errore res s que que necesitan del método estadístico para su corrección o eliminación. Como sucede cuan cuando do se dete determ rmin inan an la magn magnit itud ud de su obje objeto to a trav través és de una una simp simple le obse observ rvac ació ión; n; en dich dicha a dete determ rmin inac ació ión n siem siempr pre e se come comete ten n erro errore res s que que la Estadística corrige, si no exactamente, con un alto grado de aproximación. ESTADÍSTICA: PROF. JUDITH ALVARADO
4
UNIDAD Y DATO ESTADÍSTICO La Esta Estadí díst stic ica a basa basa sus sus leye leyes, s, no en el estu estudi dio o de una una obse observa rvaci ción ón aisl aislada ada,, individual individual,, sino en el estudio de un gran número de observacion observaciones; es; estas forman los llamados fenómenos colectivos, que se pueden definir como aquellos que para poder ser medidos necesitan de un gran número de observaciones tomadas de los fenómenos individuales que los componen. Por ejemplo, el conjunto de la natalidad de una zona, la mortalidad, el salario medio de una fábrica, etc., serían fenómenos colectivos y los nacimientos individualmente, los fallecimientos, los salarios, serían fenómenos individuales. El resultado de una observación hecha sobre un fenómeno individual se denomina "unidad estadística"; es el caso del salario de un obrero de la fábrica, el precio unitario de un producto, la magnitud de una zona cultivada, etc. El resultado de una operación estadística hecha sobre las unidades estadísticas se denomina "Dato Estadístico", de allí que un dato estadístico sería la suma total del salario s alario de una empresa, la producción total de petróleo en Venezuela, la exportación de Venezuela durante cierto período, etc. En gene genera ral, l, se pued puede e defi defini nirr el dato dato est estadís adísti tico co como como aque aquell que que mide mide un fenómeno colectivo.
POBLACIÓN, UNIVERSO, MUESTRA, VARIABLE. Población: Es el conjunto de todos los elementos de los cuales se desea conocer cierta información. Universo: Conjunto con un elevado número de elementos
una pobl poblac ació ión n es muy muy nume numero rosa sa,, reco recoge gerr dato datos s de todo todos s sus sus Muestra: Si una miem miembr bros os resul resulta ta cost costos oso o y comp comple lejo jo.. Por Por eso eso se recu recurr rre e frec frecue uent ntem emen ente te a seleccionar un subconjunto de la población, al cual se le llama muestra, y se recogen sus datos, que se consideran representativos de la población total. Variable : Es cualquier característica de la situación o de los objetos de estudio que pueda tomar valores diversos. Las variables variables pueden ser cuantitativas cuantitativas (como la edad y la estatura) y cualitativas (como el deporte preferido por una persona, el sexo o el color de tos ojos)
DIVISIÓN DE LOS MÉTODOS ESTADÍSTICOS. Los Los métod étodos os esta estadí díst stic icos os se divi divide den n en: en: Méto Método dos s Desc Descri ript ptiv ivos os y Méto Método dos s Inductivos o Generalizantes; los primeros son aquellos que tratan de condensar o resumir todos los datos o características de una serie de valores, para de esta forma describir determinados aspectos de la serie. Los Inductivos son los que tratan de estimar las características del Universo Estadístico o población total a través del estudio de una parte de este Universo; a esta parte se denomina muestra, es por ello que los métodos inductivos se han concentrado en una teoría denominada "Teoría de las Muestras", ESTADÍSTICA: PROF. JUDITH ALVARADO
5
Se dividen también los Métodos Estadísticos de acuerdo a su complejidad en: Métodos Simples y Métodos Complejos; los simples son los que se refieren al estudio de una sola característica (una variable); los complejos son los que se refi refier eren en a dos dos o más más carac caracte terí ríst stic icas as (dos (dos o más más varia variabl bles es)) dete determ rmin inad ado o la asociación o relación existente entre ellas, de allí que también se llamen Métodos de Relación. Las divisiones mencionadas determinan cuatro tipos de métodos estadísticos, a saber: - Métodos Descriptivos Simples - Métodos Inductivos Simples - Métodos Descriptivos Complejos - Métodos Inductivos Complejos. Con sólo unir las funciones de cada uno de ellos obtendremos las definiciones de los métodos mencionados.
ESTADÍSTICA DESCRIPTIVA SIMPLE Cuando Se obtienen los datos de una investigación, es necesario condensar estos datos, resumirlos a través de uno o varios valores que determinen los principales caracteres del fenómeno que se estudia; son las medidas que forman este tipo de métodos estadísticos las que logran dicho resumen. Las principales medidas de la estadística descriptiva son: a) Razon azones es,, tasas asas y porc porce entaj ntajes es:: son son medi medida das s rel relati ativas vas que que cond conde ensan nsan información sobre la incidencia de una característica entre un grupo de unidades b) La distribución de frecuencia; la más completa forma de agrupación de los datos, en la cual éstos se presentan en clases y cada clase exhibe su respectiva frecuencia c) Medi Medida das s de posi posici ción ón o de la tend tenden enci cia a cent centra ral, l, las las cual cuales es se divi divide den n en promedios matemáticos: el aritmético, el geométrico y el armónico; y promedios no matemáticos: la mediana y el modo. d) Las medidas de dispersión, que se dividen en absolutas: el intervalo total, el intervalo cuartil, la desviación media, la desviación típica y el error probable; y relativas, cuya principal medida es el coeficiente de variación. e) Los momentos, medidas de Asimetría y Kurtosos; los primeros, son medidas auxi auxili liar ares es en el cálc cálcul ulo o de otra otras s medid edidas as,, y las las de Asim Asimet etrí ría a y Kurt Kurtos osis is,, determinan la variación de la distribución con respecto a la distribución normal. ESTADÍSTICA: PROF. JUDITH ALVARADO
6
Una extens extensión ión de las medida medidas s descri descripti ptivas vas son las serie series s Cronol Cronológi ógicas, cas, que estudian el comportamiento de la distribución de una característica a través del tiempo y los Números índices, que son medidas indirectas y compuestas cuya función es la de reducir a términos relativos una determinada característica, para calcularla a través del tiempo y del espacio.
ESTADÍSTICA INDUCTIVA En algunos casos una investigación no se puede hacer con el estudio de todos estos elementos que integran el universo; por lo que se hace necesario el tomar una o varias partes de ese universo y en base al estudio de esa o esas partes, deno denomi mina nada da mues muestr tra, a, dete determ rmin inar ar todas todas las las carac caracte terí ríst stic icas as del del univ univer erso so o población total. Naturalmente, estas muestras deben ser lo más representativas del universo o población total, de allí que la escogencia y la determinación del tamaño de la muestra es uno de los problemas más importante que se plantean en los Métodos de Esta Estadí díst stic ica a Indu Induct ctiv iva. a. Para Para el estu estudi dio o de esta estas s mues muestr tras, as, la Esta Estadí díst stic ica a Descriptiva nos provee de todas sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrán la misma exactitud que tiene para la muestra, es decir, al estimarse para el universo vendrá dada con cierto margen de error; esto significa que el valor de la medidas calculada para la muestra, en el universo universo oscilará dentro de cierto cierto límite de confianza, confianza, que casi siempre siempre es de un 95 a 99 por ciento de los casos.
ESTADÍSTICA DE RELACIONES O COMPLEJA (DESCRIPTIVA O INDUCTIVA). En la práctica un fenómeno no se encuentra aislado, sino que sobre él incide una serie de factores, de otros fenómenos que lo modifican, si no totalmente, sí en forma parcial; es por ello que el estudio de un solo fenómeno, de una sola característica en forma aislada, no posee un gran valor práctico en los diversos estudios cuantitativos; en consecuencia, es necesario determinar la incidencia de un factor sobre otro, la relación causa a efecto, la asociación entre dos o más características. Estas incidencias o relaciones son estudiadas por la Estadística de Relaciones. Las princi principal pales es medida medidas s de la Estadí Estadísti stica ca de Relaci Relacione ones s son: son: el diagram diagrama a de dispersión y el diagrama de correlación que tienen un carácter gráfico, y las de carácter cuantitativo que son: coeficiente de correlación total, parcial y múltiple, line lineal al y curv curvil ilín íneo eo,, el coef coefic icie ient nte e de corre correla laci ción ón ordi ordina nal, l, las las ecua ecuaci cion ones es de regr regres esió ión n y sus sus corr corres espo pond ndie ient ntes es coef coefic icie ient ntes es.. Toda Todas s esta estas s medi medida das s son son aplicables a la Estadística Descriptiva cuando se trata de población total, y a la estadística Inductiva cuando se basa en muestras. Al igual que en la Estadística Inductiva Simple, existen en la Estadística Inductiva de Relaciones medidas de precisión y métodos para determinar el límite de confianza a las medidas de relación estimadas para la población total.
ESTADÍSTICA: PROF. JUDITH ALVARADO
7
INVESTIGACIÓN ESTADÍSTICA. DIFERENTES FORMAS DE INVESTIGACIÓN. INVESTIGACIÓN DIRECTA: Es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama también a ésta Investigación Primaria. Se divi divide de a su vez vez en exha exhaus usti tiva va o comp comple leta ta,, y parc parcia iall o inco incomp mple leta ta.. Son Son exhaustivas, aquellas que estudian todos los elementos que integran el universo, todas sus características o las necesarias para describir totalmente la población estudiada. Son Son inve invest stig igac acio ione nes s parc parcia iale les s o inco incomp mple leta tas, s, cuand cuando o tan tan sólo sólo se estu estudi dia a un número limitado de los casos individuales que forman el universo o cuando se estudian algunas manifestaciones del fenómeno que no lo describen totalmente; se utiliza este tipo de investigación cuando es imposible el estudio del fenómeno en forma completa. Este tipo de investigación puede ser representativa y no repr repres esen entat tativ iva, a, esta estamo mos s en el prim primer er caso caso,, cuand cuando o las las mani manife fest stac acio ione nes s del del fenómeno estudiado no son suficientes y necesarias para describir el fenómeno; en caso contrario, caemos dentro de las no representativas. En la Invest Investiga igació ción n Repres Represent entati ativa, va, a la parte parte o modali modalidad dades es estudi estudiadas adas del fenómeno, se denominan muestras; es decir, no son sino la aplicación de la Estadística Inductiva a la Investigación Estadística.
INVESTIGACIONES INDIRECTAS. Son aquel aquellas las en que el invest investiga igador dor se sirve sirve de inform informaci acione ones s indire indirecta ctas, s, de resultado ados o cálc álculos de investigaci aciones anteriores o en base ase de los cono conoci cimi mien ento tos s que que teng tenga a el inve invest stig igad ador or del del fenó fenóme meno no por por expe experi rien enci cias as anteriores. Se dividen estas investigaciones en conjeturas (estimaciones) y secundarias. La inve invest stig igac ació ión n conj conjet etur ural al es aquel aquella la que que en base base a cono conoci cimi mien ento tos s parci parcial ales es,, opiniones y cálculos, proporciona resultados primarios de valor práctico; este tipo de investigación presenta el inconveniente de que, dado el carácter subjetivo de esto estos s cono conoci cimi mien entos tos y opin opinio ione nes, s, se pued pueden en obte obtene nerr resu result ltado ados s dife difere rent ntes es util utiliz izand ando o vari varios os inve invest stig igad ador ores es para para el estu estudi dio o de un mism mismo o fenó fenóme meno no.. La inve invest stig igac ació ión n secu secund ndari aria a es aque aquell lla a que que se efec efectú túa a por por reagr reagrup upac acio ione nes s o reelaboraciones de resultados de otras investigaciones; tiende a su favor este tipo de investigación, que el costo y trabajo queda notablemente reducido. La investigación indirecta conjetural puede ser: por aproximación, por analogía y por proporción. Por aproximación, es aquella basada en el convencimiento que sobre el fenómeno tiene tiene el invest investiga igador dor,, ya sea por experi experienc encia ia o por result resultado ados s anteri anteriorm orment ente e obte obteni nido dos. s. Los Los dato datos s que que se obti obtien enen en en esta esta inve invest stig igaci ación ón será serán n siem siempre pre ESTADÍSTICA: PROF. JUDITH ALVARADO
8
aproximados al aplicarlos al fenómeno que se estudia, pero sirven para tener una idea general del mismo. Por analogía, son aquellas basadas en el estudio de uno o varios fenómenos que guardan cierta semejanza semejanza con el fenómeno fenómeno a investigar, investigar, determinándose determinándose ciertas modalidades y características de dicho fenómeno por procedimientos inductivos. La investigación conjetural por proporción, puede hacerse de parte a todo o de un hecho a otro; en el primer caso, se observa una parte del fenómeno y sin mayor rigor se aplica a todo el fenómeno; en el caso de un hecho a otro, se relacionan dos o más hechos y a través del conocimiento de uno de ellos se determinan las modalidades de los otros. Es conv conven enie ient nte e adve advert rtir ir el peli peligr gro o que que repr repres esen enta ta para para las las inve invest stig igaci acion ones es científicas el empleo de estas conjeturales, por parte de aquellos que no dominan el uso de los métodos estadísticos; ya que llegarían a resultados y conclusiones que tendrían muy poco grado de exactitud.
ESTADÍSTICA: PROF. JUDITH ALVARADO
9
División General Exhaustivas o completas Directa (primarias) (primarias) Parciales Parciales o incompletas
Muestras representativas No representat representativas ivas (fragmentarias)
Por aproximación Conjeturales Por analogía Parte a todo Por proporción Un hecho a otro
Indirectas Secundarias
Recopilaciones Reagrupaciones
Las investigaciones Estadísticas también se dividen, de acuerdo a su extensión o alcance geográfico, en nacionales, regionales, locales y especiales. Son nacionales aquellas que investigan las manifestaciones del fenómeno o hecho en todo el país. Son investigaciones regionales, las que limitan su estudio a una determinad determinada a región o territorio. territorio. Locales, Locales, cuando se refieren refieren a zonas pequeñas, pequeñas, ciudades, barrios o parroquias. Finalm Finalment ente, e, son especi especiale ales s todas todas aquell aquellas as invest investiga igacio ciones nes que no se refie refieren ren concretamente a las manifestaciones de un fenómeno en relación con el espacio; se encuentran en este grupo aquellas investigaciones que hacen abstracción de la distri distribuc bución ión geográ geográfic fica a del fenóme fenómeno, no, tales tales como como las prueba pruebas s de materi materiale ales, s, prueba de los neumáticos en relación a la velocidad v elocidad a que se les somete, etc.
PASOS EN EL PLANTEAMIENTO Y EJECUCIÓN DE UNA INVESTIGACIÓN ESTADÍSTICA. Es necesario advertir que los pasos que se van a enumerar se refieren a la invest investiga igació ción n direct directa a por ser ésta ésta la invest investiga igació ción n estadí estadísti stica ca por excele excelenci ncia; a; además, el orden en que se mencionarán estos datos no es necesariamente inmodificable, ya que en la práctica se sobreponen o se invierten, todo ello en relación al fenómeno que se estudia. El planteamiento y ejecución de la investigación estadística abarca los siguientes puntos: 1.- Formulación del problema específico de la investigación 2.- Desarrollo de un método para la obtención de los datos. ESTADÍSTICA: PROF. JUDITH ALVARADO
10
3.- Recolección de los datos 4.- Clasificación de los datos 5.- Análisis estadístico 6.- Presentación de los resultados 7.- Interpretación de los resultados.
1.- FORMULACIÓN DEL PROBLEMA ESPECÍFICO DE LA INVESTIGACIÓN. Encierra este paso la definición del fenómeno y la finalidad de la investigación. Es natural que sea la definición del fenómeno lo primero a realizar, ya que se debe saber qué es lo que se trata de conocer antes de comenzar a investigarlo. En lo que se refiere a la finalidad de la investigación, debe hacerse una clara exposición de la misma, persiguiendo en cuanto sea posible fines utilitarios y científicos.
2.- DESARROLLO DE UN MÉTODO PARA LA OBTENCIÓN DE LOS DATOS. Tiene esta fase un carácter subjetivo, ya que en él se necesita del esfuerzo cre creati ativo y cons constr truc ucti tivo vo del del inves nvesti tiga gado dor; r; ya sea sea para ara el estud studiio de los antecedentes o experiencias similares hechas sobre el tema de la investigación, que para la determinación de las posibilidades y recursos con que se cuenta o para la recolección de los nuevos datos. El estudio de los antecedentes y experiencias similares es de una gran ayuda al investigador, ya que de esta manera se pueden mejorar los procedimientos a utilizar y se prevé las dificultades que puedan presentarse en la investigación; ademá además s se pued pueden en util utiliz izar ar los los dato datos s de esas esas expe experi rien enci cias as para para comp comple letar tar o comp compro roba barr los los obte obteni nido dos. s. En lo que que se refi refier ere e a la dete determ rmin inac ació ión n de las las posibilidades y recursos con que se cuenta para llevar a cabo la investigación, representa algo esencial dentro del planteamiento de la investigación; ya que son esta estas s posi posibi bili lidad dades es o recu recurso rsos s que que se trad traduc ucen en en tiem tiempo po,, dine dinero ro,, pers person ona, a, materias, etc. las que limitan el alcance y contenido de la investigación. Sería lamentable que por no haber previsto estas limitaciones se deba en un momento determinado terminar la investigación sin haber logrado su finalidad.
3.- RECOLECCIÓN DE LOS DATOS. Es el punto más importante dentro de la investigación estadística. En dicho paso nos proveeremos de los datos necesarios para llegar a conclusiones sobre el fenómeno investigado; de allí que deba tenerse la Recolección de Datos como el fin supremo del planeamiento y ejecución de una investigación estadística. Previo a la recolección propiamente de los datos, se debe hacer la determinación del del Un Univ iver erso so Esta Estadí díst stic ico, o, de la unid unidad ad de la inve invest stig igac ació ión n y del del mome moment nto o estadístico, así como la elaboración del cuestionario. El Universo Estadístico consiste en fijar cuáles son los casos individuales que van a ser ser obse observ rvad ados os,, así así como como el alca alcanc nce e en el espac spacio io y en el tiem tiempo po de la investigación. La unidad de la investigación la constituyen los casos individuales ESTADÍSTICA: PROF. JUDITH ALVARADO
11
que que se est estudi udian en la inves nvesti tiga gac ción ión a travé ravés s de los cual cuales es se lleg llega a a la observación del fenómeno. El momento estadístico es el instante o período a que se van a referir los datos individuales; entendiéndose por datos individuales las diferentes modalidades que toman los caracteres que constituyen la unidad de investigación. La elaboración del cuestionario, consiste en preparar una lista de las preguntas cuyas respuestas proporcionarán los datos. Hech Hechos os todo todos s esto estos s punt puntos os se está está en cond condic ició ión n de real realiz izar ar el traba trabajo jo en el terreno, cuando se realiza la investigación por primera vez. En caso que se deban utilizar datos ya recolectados, se toman de los registros y se investiga la forma en que fueron recolectados, para comprobar la veracidad de ellos.
4.- CLASIFICACIÓN DE LOS DATOS. Después que los datos han sido recolectados, éstos se presentan en su forma primaria sin ninguna organización, lo que hace imposible el análisis de ellos; en consecuencia, se hace necesario clasificar estos datos; clasificación que se lleva a efecto a través de la revisión, el agrupamiento agrupa miento y tabulación de los datos. Consiste la revisión en la inspección de los formularios y de los registros donde se han reunido los datos para corregir los errores, las respuestas ilógicas y encontrar las omisio omisiones nes;; el resul resultad tado o de esta esta revisi revisión ón debe debe ser: ser: aprobac aprobación ión,, rechaz rechazo o o devolver el cuestionario al empadronador para su terminación. Agrupamiento significa volcar en una sola hoja todos los datos contenidos en los cuestionarios separados. Tabulación, se define como el listado de los datos en clas clases es.. Todo Todo este este proc proces eso o pued puede e real realiz izar arse se de acue acuerd rdo o a la magn magnit itud ud de la investigación en forma manual, semi mecánica o mecánica.
5.- ANÁLISIS ESTADÍSTICO. Después de hacer una clasificación lógica de los datos, éstos se encuentran en condiciones de ser analizados desde el punto de vista estadístico. Es en este paso donde el profesional de la Estadística (estadístico o estadígrafo), tiene su mayor función, ya que se van a calcular todas las medidas de los métodos descriptivos e inductivos, simples y complejos. En resumen, en este paso al conjunto de los datos obtenidos a través de la recolecció recolección n se condensan, se estiman sus medidas medidas en función función del universo universo total, total, se determinan sus relaciones y se prueban hipótesis.
6.- PRESENTACIÓN DE LOS RESULTADOS. Tiene este punto un carácter que podemos llamar publicitario, ya que en él se presenta al público no conocedor científicamente del fenómeno, los resultados obtenidos. Esta presentación, puede hacerse en la siguiente forma: textual a través de letras y símbolos algebraicos, tabular o semi tabular a través de los cuadros estadísticos, gráfica a través de esquemas y diagramas, y finalmente, por ESTADÍSTICA: PROF. JUDITH ALVARADO
12
medio de modificaciones de la forma gráfica, como son las formas pictóricas y los mapogramas (mapas estadísticos). En la presentación de los resultados debe considerarse en lo posible hacia quienes va dirigido, tratando siempre de elegir la forma más comprensible y efectiva.
7.- INTERPRETACIÓN DE LOS RESULTADOS. Consiste en traducir las medidas estadísticas obtenidas en lenguaje relativo al fenómeno o hecho estudiado; de allí que se necesite al Estadígrafo o al científico de la materia a que se refiera la investigación; es este último el que interpretará lo hallado o emitirá principios, leyes, etc., sobre el problema investigado.
FUENTES Y RECOLECCIÓN DE DATOS. FUENTES DE DATOS. Los datos necesarios para la investigación estadística pueden obtenerse a través de diferentes fuentes: primarias y secundarias, oficiales y privadas. Son fuen fuente tes s prim primari arias, as, la pers person ona a o inst instit ituc ució ión n que que ha reco recole lect ctad ado o los los datos, datos, y secundarias si la persona o agencia que ha publicado los datos no es la que ha efectuado la investigación. La fuente primaria más notable y de mayor utilización en todos los países, es la encargada de publicar los datos relativos a los Censos Nacionales; en la práctica, es aconsejable el utilizar fuente de datos primarios; sin embargo, de acuerdo a la naturaleza del fenómeno, si no es posible la utilización de fuentes primarias, se aconseja utilizar las secundarias, siempre y cuando la oficina que las publique tenga suficiente solvencia técnica. Cuando los datos son provistos por cualquiera dependencia gubernamental, se llaman fuentes oficiales; los provistos por agencia, personas, organizaciones. etc., no gubernamentales, son fuentes privadas. Sobre estos dos tipos de fuentes no se puede dar prioridad de una sobre otra; si acaso, se recomiendan como utilizables las estadísticas demográficas que practican los institutos oficiales.
MÉTODOS DE RECOLECCIÓN DE DATOS La recolección real de los datos se puede hacer a través de las siguientes formas: a) Entrevista personal b) Cuestionario por correo c) Entrevista por teléfono d) Observación directa. La entr entrev evis ista ta pers person onal al consi consist ste e en envi enviar ar un entr entrev evis istad tador or dire direct ctam amen ente te al investigado, formulándole aquél las preguntas necesarias en la investigación. Este procedimiento permite obtener una información más consistente y con un mayor número de respuestas, ya que las preguntas pueden hacerse con mayor detalle, ESTADÍSTICA: PROF. JUDITH ALVARADO
13
además se puede comprobar la veracidad de las respuestas por medio de la aprecia apreciació ción n person personal al por parte parte del invest investiga igador dor y correg corregir ir cierto ciertos s errore errores s que sucedan en la primera visita a través de una segunda visita al entrevistado. Otra ventaja muy importante de la entrevista personal es la posibilidad que tiene el investigador de adaptar el lenguaje de tas preguntas a la capacidad o nivel intelectual de las personas interrogadas. Como limitaciones de este método, podemos mencionar su alto costo, lo que muchas muchas veces veces hace hace imprac impractic ticabl able e la invest investiga igació ción, n, ya que en invest investiga igacio ciones nes extensas se necesita un gran número de agentes, a lo que es necesario dar una preparación especial y vigilar en el momento de la recolección para que no vayan a tergiversar las respuestas; naturalmente, todas estas operaciones encarecen altamente la investigación. El méto método do del del cues cuesti tion onari ario o por por corr correo eo consi consist ste e en envi enviar ar por por esa esa vía vía a las las pers person onas as que que se va a inve invest stig igar ar la list lista a de preg pregun unta tas, s, con con las las inst instru rucc ccio ione nes s necesarias. En algunos casos la distribución se hace a través de agentes, cuya única función es dejarlo a las personas investigadas. Las ventajas que presenta este método consisten en que el costo se reduce enormemente en relación al método anterior, ya que sólo se necesita el pago del franqueo por el envío de los cuestionarios o el pago a los agentes repartidores, los cuales no necesitan una preparación especial; además, se elimina la influencia del entrevistador al sugerir las respuestas y el entrevistado puede contestar con suficiente tiempo y comodidad el cuestionario. Sin embargo esta forma de recolección de presenta graves inconvenientes; uno de ellos es que sólo un porcentaje bastante bajo de los cuestionarios enviados son devueltos; en la práctica, el porcentaje por promedio que se devuelve es de un 10%. Otro inconveniente consiste en no poder garantizar que efectivamente los formul formulario arios s hayan hayan sido sido recibi recibidos dos por las person personas as que se encuen encuentran tran en capacidad de dar la información solicitada, lo que trae consigo una serie de errore errores s en los result resultado ados, s, errore errores s que son imposi imposible bles s rectif rectifica icarr por no tener tener prueba para verificar la exactitud exa ctitud o sinceridad de las respuestas. Cuando se utiliza este sistema es aconsejable adjuntar una hoja de instrucción, en la cual todas las preguntas se encuentran ampliamente explicadas, para evitar las interpretaciones erróneas de las mismas por parte del entrevistado. La aparente ventaja de mayor tiempo y comodidad para responder las preguntas, puede puede resul resultar tar una desven desventaj taja a cuando cuando no son devuel devueltos tos oportu oportunam nament ente e los cuestionarios repartidos, lo que alarga el tiempo y la duración de la investigación. La entrevista por teléfono consiste en telefonear al entrevistado y formularle las preguntas necesarias. Este sistema tiene la ventaja de que se logra realizar la investigación en un tiempo relativamente corto, además, presenta un costo bajo porque la preparación e inspección de los entrevistadores es fácil. Cuando se ESTADÍSTICA: PROF. JUDITH ALVARADO
14
trata de una investigación muestral, la repartición geográfica de las muestras es sencilla; sin embargo, esta muestra no es casi siempre representativa. Las limitaciones que presenta se refieren, a que el número de preguntas que se formula son reducidas, y no existe forma de descubrir las respuestas falsas. En la observación directa se recogen los datos y elementos de juicio a través de agentes especializados directamente sobre el terreno, sin formular ningún tipo de pregunta. pregunta. Este método puede dar resultados aceptables aceptables y objetivos objetivos siempre que se logre eliminar la faceta humana y subjetiva del entrevistador; para ello es necesario contar con personal especializado y conocedor del fenómeno, capaz de interpretar los aspectos que interesan del fenómeno, capaz de interpretar los aspe aspect ctos os que que inte intere resa san n del del fenó fenóme meno no y por por últi último mo pued puede e trad traduc ucir irse se en una una desven desventaj taja, a, por ser muy difíci difícill encont encontrar rar el sufici suficient ente e person personal al compet competent ente e y recopilar todos los datos que requiere la investigación. Cabe Cabe obse observ rvar, ar, que que en much muchas as inve invest stig igac acio ione nes s se comb combin inan an algu alguno nos s de los los métodos de recolección ya mencionados; esto las hace más completas y permite obtener un mayor número de datos con un alto porcentaje de veracidad.
EL CUESTIONARIO: Determinadas las fuentes de los datos, es necesario la elaboración de una lista o relación de las preguntas cuya contestación proporcione los datos de cada caso caso indi indivi vidu dual al.. A la prese present ntac ació ión n orde ordena nada da y sist sistem emáti ática ca de dich dicha a list lista a de pregun preguntas tas se denomi denomina na Cuesti Cuestionar onario; io; tambié también n puede puede llamar llamarse se boleta boleta,, cédula cédula,, mode modelo lo,, bole boletí tín, n, fich ficha, a, tarj tarjet eta, a, plan planil illa la,, etc. etc. Este Este cues cuesti tion onar ario io segú según n la inform informaci ación ón recogi recogida da será será indivi individual dual cuando cuando se refie refiere re a un solo solo indivi individuo duo,, y colectivo si se refiere a un grupo de individuos. El cuestionario consta de las siguientes partes: a) La que contien contiene e los informe informes s que lo identifi identifican can b) Que contiene contiene los datos efectivos efectivos de carácter carácter social social y de identifica identificación ción de la persona entrevistada. La primera parte contiene: el número del cuestionario, el nombre de la encuesta, el título el cuestionario, nombre del patrocinante de la encuesta, y finalmente, el lugar y fecha de la entrevista. La segunda segunda parte contiene: contiene: apellidos apellidos,, nombres, nombres, sexo, edad, cédula de identidad, identidad, fecha de nacimiento, lugar de nacimiento, nacionalidad, estado civil, grado de instrucció instrucción, n, profesión, profesión, ocupación ocupación actual, actual, etc., etc. Naturalment Naturalmente, e, todas estas estas preg pregun unta tas s vari variar arán án en func funció ión n de la fina finali lida dad d de la encu encues esta ta;; en much muchos os cuestionarios los datos personales se eliminan por no interesar a la investigación. Por ser el cuestionario lo que va a proporcionar los datos individuales, que son la base de la investigación estadística, deben tomarse en cuenta en la elaboración de las las preg pregun unta tas s los los obje objeti tivo vos s de la inve invest stig igac ació ión; n; para para ello ello,, es nece necesar sario io considerar los siguientes puntos: ESTADÍSTICA: PROF. JUDITH ALVARADO
15
1. Hay que tomar tomar en cuenta quién quién anotará las las respuestas respuestas en el cuestionari cuestionario o (el entrevistado o el entrevistador) 2. Es necesari necesario o tomar tomar en cuenta cuenta el aspecto, aspecto, conteni contenido do y extens extensión ión que debe tener el cuestionario, el cual variará de acuerdo con el tipo de encuesta. 3. Para Para cada cada tipo tipo de encuest encuesta a se deberá deberá determ determina inarr el número número de pregun preguntas tas del cuestionario, tratando de que con el menor número de éstas se obtenga mejor información. 4. Hay Hay que que toma tomarr en cuen cuenta ta si el cues cuesti tion onari ario o será será util utiliz izad ado o en encu encues esta tas s periódicas. 5. Es necesari necesario o saber saber qué manipu manipulac lación ión o tratam tratamie iento nto le dará dará el personal personal de oficina a los datos. 6. Es importante importante tomar tomar en cuenta cuenta el tamaño, tamaño, calidad y color color del papel. papel. En lo que que se refi refier ere e a la reda redacc cció ión n de las las preg pregun unta tas, s, menc mencio iona nare remo mos s las las sigu siguie ient ntes es cond condic icio ione nes s impr impres esci cind ndib ible les s para para obte obtene nerr resu result ltad ados os lógi lógico cos, s, verdaderos y precisos:
a) Sencillez en la preparación: Se deben incluir tan solo aquellas preguntas que tengan relación con la encuesta y que sean suficientes para descubrir el fenóme fenómeno no en sus caract caractere eres s especi especiale ales, s, solame solamente nte se debe debe agrega agregarr aquellas complementarias que puedan servir de control o comprobación de alguna algunas s respuesta respuestas. s. Se debe tomar tomar en cuenta cuenta el tiempo tiempo que durará durará el inte interr rrog ogat atori orio, o, ya que que los los inte interr rrog ogat ator orio ios s dema demasi siad ado o larg largos os,, fati fatigan gan al investigado y lo predisponen a no responder o dar respuestas falsas.
b) Claridad en la redacción: Debe evitarse hacer preguntas que den lugar a resp respue uest stas as inco incorr rrec ectas tas o inex inexac acta tas; s; si es nece necesar sario io se debe deberán rán incl inclui uirr aclaraciones o definiciones, pero sin caer en ambigüedades literarias que confundan aún más. Debe tratarse tratarse de obtener las las respuestas respuestas mediante mediante “si” o “no” o en números; ya que de esta forma se evitan las declaraciones vagas de difícil clasificación o el que no se dé respuesta por no entender bien la pregunta. Cuan Cuando do se pide piden n las las resp respue uest stas as en unid unidade ades s de medi medida das, s, debe debe defi defini nirs rse e claramente cuál es la clase de unidad y su naturaleza. na turaleza.
c) Discreción en las preguntas preguntas . Se deben encaminar las preguntas a averiguar hechos, comprobar lo que sabe el informante y no descubrir sus creencias, opiniones o actitudes, a menos que la encuesta vaya dirigida a obtener esa información. En lo posible deberán evitarse preguntas curiosas, relativas a datos personales del entrevistado que puedan ofender la dignidad o rozar el amor amor prop propio io del del mism mismo; o; así así como como no ir cont contra ra sus sus prin princi cipi pios os moral morales es,, religiosos o políticos, o contradecir disposiciones legales. Tam Tambi bién én debe debe evit evitar arse se que que el entr entrev evis ista tado do deba deba autoc autocal alif ific icars arse, e, ya que que necesitará demasiada demasiada sinceridad para evidenciar una situación negativa. negativa. harán preg pregun untas tas que que den den dema demasi siad ado o d) Facilidad Facilidad de contesta contestación ción.. No se harán trabajo al informante para responderlas, tales como las que exigen esfuerzo ESTADÍSTICA: PROF. JUDITH ALVARADO
16
de memo memori ria, a, ni exig exigir ir resp respue uest stas as en que que se deban deban efec efectu tuar ar cálc cálcul ulos os numéricos, como porcentajes, promedios, etc. Se aconseja en lo posible indi indica carr las las resp respue uest stas as frec frecue uent ntes es para para cada cada preg pregun unta ta;; para para que que el entrevistado no tenga sino que marcar las respuestas que le corresponda, por ejemplo, cuando se refiere al estado civil Soltero Casado Viudo Otro
e) Ordenamiento lógico de las preguntas. Esto significa que se deben agrupar aquellas preguntas afines, procurando que una se relacione con la otra o que figuren en sucesión lógica. Debe colocarse en primer lugar los datos generales, que son comunes en todos los casos y al final aquellos datos excepcionales que son propios del fenómeno que se estudia; esto ayuda enormemente al proceso de crítica y revisión de los datos.
Ejemplo de cuestionario CONSUMO DE GASOLINA Entrevistador Nº______________________Cuestionario Nº______________ Zona Nº ____ 1)
Dirección ___________________________ ________________________________________ _____________
Tipo de Expendio: Estación de Servicio Bomba Garaje
Tipo de Vehículo: Automóvil 1 Camioneta 2 Autobús 3 Camión 4 Motocicleta Modelo___________________
2) 1 2 3
3)
5) Tipo de Gasolina utilizada: De 91 octanos 1 De 95 octanos 2 Sin plomo 3
Marcas de gasolina: Corpoven 1 Shell 2 Maraven 3
4) Uso a que está destinado el vehículo: Alquiler 1 Particular 2 Oficial 3 5
Marca:___________________ 6) ¿Por qué usa esta gasolina? Por ser más barata 1 Por convenir más al vehículo 2
7) ¿Cómo se comporta el vehículo con esta gasolina? Bien
1
Mal
2
ESTADÍSTICA: PROF. JUDITH ALVARADO
Regular
3 17
8) Datos del conductor: Profesión:____________________ Ocupación actual_____________________ 9) ¿De quién es este carro? Propio 1 Alquilado 2 Del patrón
3
10) Placa Nº _____________________
Recolección Real de los Datos Aun cuando se haya hecho un cuidadoso planteamiento de la investigación, una correcta preparación del formulario y se escoja la forma de investigación apropiada, siempre en el momento de recolección se presentará una serie de inconvenientes que deben deben ser resueltos por el entrevistador. Es por ello que éste debe debe poseer poseer en lo posibl posible e las siguie siguiente ntes s condic condicion iones: es: una educac educación ión superio superiorr media, un carácter extrovertido necesario para tratar con gentes de todas las clases clases,, rapidez rapidez de observ observaci ación, ón, facili facilidad dad para captar captar todos todos los datos datos útiles útiles,, cond condic icio ione nes s para ara refe referi rirr con exact xactit itud ud los infor nform mes obte obteni nido dos, s, act actitud itud comunicativa y cordial, ser sociable y saber interesar, integridad, objetividad y honestidad en el trabajo. Naturalmente, todas estas condiciones son muy difíciles de encontrar en una persona; de allí que se hace necesario instruirlos con anterioridad sobre el objeto e importancia de la encuesta, exigiéndole el perfecto conocimiento de las preguntas y su forma de obtenerlas; para tal fin, se proveerá a los entrevistadores de una hoja de instrucciones que contengan los puntos necesarios para una mejor realización de la entrevista.
MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA: Para datos no agrupados . Es la suma de los valores de una variable variable dividida dividida por el número de datos, datos, permite permite representar representar un grupo con un n
solo dato, se representa
X .
La media expresada en forma algebraica
∑ xi X =
i =1
N
= la media y se lee x barra; N = número de datos; ∑ = El verbo matemático, que nos ordena sumar todas las observaciones. X
MEDIA MEDIA PONDER PONDERADA: ADA: Distr Distrib ibuci ucion ones es de frecu frecuenc encias ias no Agru Agrupad padas. as. Puede expresarse como la suma de los productos de cada uno de estos números por sus corr corre espo spondie ndient nte es peso pesos s (pon (ponde dera raci cion one es) divi dividi dida da entr entre e la sum suma de las n
∑ wi . xi ponderaciones, y se denota por
X w
En simbología X w =
i =1 n
∑ wi i =1
ESTADÍSTICA: PROF. JUDITH ALVARADO
18
MEDIANA ( M e ): Es una medida descriptiva, indica un punto sobre o bajo el cual se encuentra el 50% de los datos, es decir, es un valor que divide a un conjunto de datos en dos partes iguales y la denotamos por M e , si el número de datos es par, realizaremos la semisuma de los dos datos centrales.
MODA ( M o ): En un grupo de datos es aquel valor que se repite con mayor frecuencia, y lo denotamos por M o .
PROCEDIMIENTO PARA SU CÁLCULO: PASO Nº 1. Agrupe los datos de menor a mayor (tómese la molestia de volver a contar el número de observaciones, uno solo de los datos que omita y todo el ejercicio estará incorrecto).
PASO Nº 2. CÁLCULO DE LA MODA. Tome en cuenta el dato que más se repite (esto se hace por simple inspección). Un grupo de datos puede tener una moda, dos modas (bimodal), tres modas (trimodal) (trimodal) o simplemente simplemente no tener moda.
PASO Nº 3. CÁLCULO DE LA MEDIANA: Tenga en cuenta el número de datos. Si los datos son impares simplemente divida el número entre 2, al cociente súmele 1, el resultado será el valor del dato que ocupa la mediana, pero si el número de datos es par, sume los 2 datos centrales y divida entre dos. Por ejemplo, ejemplo, si el número de datos es 21, 21, al dividir entre dos es 10, 10, sume sume 1, 1, el resultado es 11. El dato que ocupa el lugar Nº 11, será la mediana. Si el número de datos es 16, divida entre dos, el resultado es 8 y no hay residuo. Tome los los datos que ocupan ocupan los lugares lugares Nº 8 y el Nº 9, sume los los datos y divida entre dos. Esta semisuma será la mediana.
PASO Nº 4. CÁLCULO DE LA MEDIA. Sume todos los datos y divida entre el número total de observaciones.
TABLA DE DISTRIBUCIÓN DISTRIBUCIÓN DE FRECUENCIAS ORDENAMIENTO DE DATOS: A menudo, los conjuntos que contienen una gran cantidad de elementos se organizan en grupos o clases. Los elementos se asignan a las las clas clases es corr corres espo pond ndie ient ntes es;; lueg luego, o, se cons constr truy uye e una una distri distribuc bución ión de frecuenci frecuencia a para para datos datos agrupado agrupados s y se repr repres esen enta ta medi mediant ante e una una gráf gráfic ica. a. Aunque no hay reglas fijas para establecer las clases, la mayoría de los estudiosos en estadística coincide en algunas normas generales: 1.- Asegúrese de que cada dato esté en una y solamente en una clase. 2.- Trate de confeccionar todas las clases de un mismo ancho (que contengan el mismo número de elementos). 3.- Asegúrese de que las clases sean mutuamente excluyentes. ESTADÍSTICA: PROF. JUDITH ALVARADO
19
4.- Utilice de 5 a 12 clases. (Muy pocas clases o demasiadas clases pueden oscurecer el comportamiento de los datos).
Tengamos claro algunas definiciones importantes: Los intervalos son los límites a los extremos a los que llega una función. Son utilizados a modo de resumen cuando la cantidad de datos es muy grande. Los límites extremos de cada clase se les llaman Límite Inferior y Superior de clase respectivamente. Los intervalos se definen como: •
Abiertos: se colocan entre paréntesis (por ejemplo (-3; 5)). Esto quiere decir que la función no toca los puntos -3 y 5 sino que llega a -2.99999 y a 4.9999.
•
Cerrados: se expresan entre corchetes (por ejemplo [-3; 5]). Esto significa que la función empieza en -3 y termina en 5). (Vamos a trabajar con este tipo)
•
Semi abiertos: se expresan con un paréntesis de un lado y un corchete del otro otro (por (por ejem ejempl plo o (-3; (-3; 5]; 5]; esto esto quie quiere re deci decirr que que la func funció ión n empi empiez eza a en -2.99999 y termina en 5).
Existen también Límites Reales Inferior y Superior de clase, estos se obtienen sumando el límite superior de un intervalo de clase con el límite inferior de la clase siguiente y dividiéndolos entre dos.
Marca de clase es el punto medio de cada clase y se obtiene sumando los límites de clase y dividiéndolos entre dos.
Tamaño o anchura de clase o intervalo de clase: Es la diferencia entre dos límites consecutivos. Frecuencias Frecuencias simples: El número de veces que se repite un dato. Frecuencias Frecuencias acumuladas: acumuladas: La suma de cada frecuencia con la frecuencia de la clase contigua superior. Frecuencias Frecuencias relativas: Es la relación que existe entre la frecuencia simple entre el número total de observaciones. Frecuencias relativas porcentuales : La frecuencia relativa multiplicada por 100 para tenerlas en forma de porcentaje. Frecuencias relativas acumuladas: la suma de cada frecuencia relativa con la frecuencia relativa de la clase contigua superior. ESTADÍSTICA: PROF. JUDITH ALVARADO
20
Rango: dato mayor menos dato menor.
Veamos un ejemplo: A 40 estudiantes, elegidos de manera aleatoria en la cafetería de la escuela un lunes por la mañana, se les pidió que estimaran el número de horas que habían dedicado a estudiar en la semana anterior (incluidas las horas dentro y fuera de clase). He aquí el registro de sus respuestas 18 60 72 58 20 15 12 26 16 29 26 41 45 25 32 24 22 55 30 31 55 39 29 44 29 14 40 31 45 62 36 52 47 38 36 23 33 44 17 24 Encuentre las medidas de tendencia central: Media, mediana, moda, realice un histograma circular, una tabla de frecuencias.
PASO Nº 1 Orde Ordene ne los los dato datos s de meno menorr a mayo mayor, r, no impo import rta a cuán cuánta tas s vece veces s se repi repita tan, n, colóquelos todos, Táchelos en la hoja de la prueba, así no le quedará ninguna duda de que tomó todos los datos. 12-14-15-16-17-18-20-22-23-24-24-25-26-26-29-29-29-30-31-31-32-33-36-36-3839-40-41-44-44-45-45-47-52-55-55-58-60-62-72. La moda y la mediana se realizan por simple inspección.
PASO Nº 2 La moda es el dato que más se repite: En este ejercicio es 29.
PASO Nº 3
La mediana es el dato que ocupa el lugar central pero cuando los datos son impares. En este ejercicio los datos son pares, así que debemos tomar los 2 centrales (en este caso 31 y 32) súmelos y divida el resultado entre dos, ese será el valor de la mediana 31,5.
PASO Nº 4
La media es la suma de todos los datos dividido entre el número de ellos: n
∑ xi X =
i =1
N
=
1362 40
= 34 ,1 ≅ 34
Calcule el rango o recorrido de la función R = V máximo R= 60
– V mínimo ; R = 72-12
Número de clases, número de grupo o número de filas con los que contará la tabla. El tamaño o amplitud de dicho intervalo debe ser tal que no haya ni excesivas clases ni muy pocas. Si hay demasiadas clases es posible que algunas de ellas no tengan frecuencias y si son pocas puede quedar muy comprimida, perdiéndose alguna valiosa información de la manera como se distribuyen los datos. Para ello ESTADÍSTICA: PROF. JUDITH ALVARADO
21
se aplica la Regla de Sturges, ella nos puede indicar de manera aproximada el número de filas con que contará la tabla y que obedece a la fórmula: Nº de clases = 1 + 3,22. log N, siendo N el número de observaciones. En este caso N = 1 + 3,22. 3,22. 1,60205 1,602059991 9991 N = 6,15863 6,158633172 3172… … El número número de filas será 6. El decimal indica que es menor que 5 así tomaremos 6 filas. Este valor siempre será un número natural. Para calcular el intervalo de clases, (el ancho del intervalo o el número de datos que estará en cada intervalo) se utiliza la fórmula En este ejercicio Ic =
60 6
Ic
=
Rango N º de
filas
=10
En este caso debemos tomar como intervalo de clase 10
Clas fs e 12 –
7
fr=
fs N
7/40=0,17 21 5 22 - 13 13/40=0,3 31 25 32 - 8 8/40= 0,2 41 42 - 5 5/40=0,12 51 5 52 - 5 5/40=0,12 61 5 62 - 2 2/40=0,05
72
fr %=frx1 00
Fa= ∑ fs 7
32,50%
7+13= 20 20+8= 28 28+5= 33 33+5= 38 38+2= 40
12,5% 12,5% 5%
∑ fs N
17,50 %
20%
Far=
7/40=0,1 750 20/40=0, 5 28/40=0, 7 33/40=0, 825 38/40=0, 95 40/40= 1
Far %=Farx10 0
α
fs N
= .3
60
17,50%
63º
50%
117º
70%
72º
82,5%
45º
95%
45º
100%
18º
Pasos para la elaboración de la tabla de frecuencias PASO Nº 1 Desp Despué ués s de los los cálc cálcul ulos os ante anteri rior ores es,, en la colu column mna a Nº 1, colo coloqu que e el valo valorr encontrado más pequeño de los que ordenó. En la segunda fila coloque la suma del primer valor más el Ic (12 + 10 = 22), así sucesivamente hasta llegar al último intervalo al que le sumaremos el intervalo de clase (62 + 10 = 72). Para el límite superior de cada clase, reste al valor de la segunda fila una unidad. 22-1 = 21, este valor colóquelo en la primera fila y tendrá el intervalo de la clase. Aplique para las siguientes clases.
PASO Nº 2 Revise el número de datos, cuente cuántos datos se encuentran entre los valores de cada una de las clases. En el ejemplo: ESTADÍSTICA: PROF. JUDITH ALVARADO
22
En la clase Nº 1, se encuentran 12-14-15-16-17-18-20 (7 datos). En la clase clase Nº 2,se 2,se encuen encuentra tran n 22-23 22-23-24 -24-24 -24-25 -25-26 -26-26 -26-29 -29-29 -29-29 -29-30 -30-31 -31-31 -31 (13 datos). En la clase Nº 3, se encuentran 32-33-36-36-38-39-40-41 32-33-36-36-38-39-40-41 (8 datos). En la clase Nº 4, se encuentran 44-44-45-45-47 (5 datos). En la clase Nº 5, se encuentran 52-55-55-58-60 (5 datos). En la clase Nº 6, se encuentran 62-72. (2 datos).
PASO Nº 3 Calcule la frecuencia relativa, divida cada frecuencia simple entre el número de datos, para los efectos tome 4 cifras decimales, aproxime con el 5º decimal, si es 5 o mayor que 5, proceda al a l aumento a la cifra siguiente.
PASO Nº 4 Calcu Calcule le las las frec frecue uenc ncia ias s acum acumul ulada adas, s, en la prim primer era a fila fila se colo coloca ca la prim primer era a frecuencia, en la segunda fila se coloca la suma de la primera con la segunda frecuencia simple y así sucesivamente, la última fila debe dar el valor de la sumatoria de los datos.
PASO Nº 5 Calcule las frecuencias acumuladas relativas como la relación entre la frecuencia acumulada entre el número de términos u observaciones.
PASO Nº 6 Calcule las frecuencias acumuladas relativas porcentuales como las frecuencias acumuladas relativas por 100.
PASO Nº 7 La última columna nos indica el ángulo de barrido cuando se va a realizar un histograma circular, se calcula como la relación entre la frecuencia simple entre el número de términos multiplicado por 360º α
=
fs x 360 360 N HORAS DE ESTUDIO
12 – 21 22 - 31 32 - 41 42 - 51 52 - 61 62 - 72
ESTADÍSTICA: PROF. JUDITH ALVARADO
23
PASO Nº 8 Interpretación de los datos: Se comienza con la frecuencia relativa porcentual y luego el intervalo de clase.
En el ejemplo anterior se interpreta i nterpreta de la siguiente manera: De los 40 estudiantes entrevistados se conoce que:
El 17,50% 17,50% de ellos ellos estudió entre 12 y 21 horas El 32,5 entre 22 y 31 horas El 20% entre 32 y 41 horas El 12,5% entre 42 y 51 horas El 12,5% entre 52 y 61 horas El 5% entre 62 y 72 horas
PASO Nº 9 El final de este ejercicios es el bosquejo de La Ojiva, curva asociada con la frecuencia acumulada (fa), o a la frecuencia acumulada relativa porcentual (Far %), la forma de esta curva es sigmoidal (Parecida a una S). a) Calcule el primer límite real (Sume el primer límite superior con el límite superior de la clase siguiente, divida estos valores entre dos) Lr 1 =
LS 1 + L I 2 2
b) Reste el valor encontrado del primer límite superior. El valor encontrado lo llamaremos incremento ( ∆= Lr 1 − Ls1 ) ) c) Sume este valor valor a todos todos los límites límites superiore superiores s d) Reste dicho dicho valor al primer primer límite límite inferior inferior (este valor será el dato cero) cero) e). Intercepto el límite real superior de cada clase y la frecuencia de cada una de ellas para luego unir esos puntos a través de segmentos de rectas.
ESTADÍSTICA: PROF. JUDITH ALVARADO
24
CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL EN DATOS AGRUPADOS. Cuando los datos están agrupados agrupa dos en una tabla de frecuencias, el cálculo de las medidas de tendencia central se realiza con las siguientes fórmulas: Media aritmética = L sia
Md
Pm . f ∑ Pm ; x =
N − f Aia +ic 2 fsi
s
Moda Mo
N
f p = L sia + ic f p + f a
; Mediana
.
Veamos el siguiente ejemplo:
Variable 2,6 – 3,2 3,3 – 3,9 4,0 – 4,6 4,7 – 5,3 5,4 – 6,0 6,1 – 6,7
Límite inferior (más chico)
fs 1 2
Frecuencia anterior
13 11 2 5
Frecuencia posterior
Límite superior (más grande)
Los datos están agrupados y sólo tienen la frecuencia simple.
CÁLCULO DE LA MODA f p Fórmula Mo = L sia + ic f p + f a Glosario: = Límite superior del intervalo anterior (en este caso el límite superior del intervalo anterior que contiene la moda) ic: ic: Inte Interv rval alo o de clas clase, e, (se (se obti obtien ene e de la rest resta a o dife difere renc ncia ia de dos dos lími límite tes s consecutivos. Uno detrás detrás del otro) f p : Frecuencia posterior del intervalo que contiene la moda f a : Frecuencia anterior del intervalo que contiene la moda L sia
PASO Nº 1 Verifique en la columna de la frecuencia simple el intervalo que contiene el mayor número (En este ejercicio es el número 13)
PASO Nº 2 Localice el límite superior del intervalo anterior del dato que contiene la moda (En este caso 3,9).
ESTADÍSTICA: PROF. JUDITH ALVARADO
25
PASO Nº 3 Calcule el intervalo de clase (Reste dos límites consecutivos 3,3 – 2,6 = 0,7)
PASO Nº 4 Verifi Verifique que cuále cuáles s son los valore valores s que corres correspon ponden den a la frecue frecuenci ncia a anteri anterior or y poster posterior ior del interv intervalo alo que contie contiene ne la moda. moda. (En este este ejerci ejercicio cio la frecue frecuenci ncia a anterior es 2 y la frecuencia posterior es 11).
PASO Nº 5 11 11 + 2
Sustituya los datos encontrados en la fórmula. Mo = 3,9 + 0,7
= 4,492307692,
como esta stamos traba abajand ando con décimas, haga aga las aproximaciones del resultado a décimas. Por lo tanto el valor de la Moda es 4,5 M o
CÁLCULO DE LA MEDIANA: Fórmula
Md
Glosario:
= L sia
N − F Aia +ic 2 fsi
= Límite superior del intervalo anterior (que contiene la moda). ic: ic: Inte Interv rval alo o de clas clase, e, (se (se obti obtien ene e de la rest resta a o dife difere renc ncia ia de dos dos lími límite tes s consecutivos. Uno detrás detrás del otro) N: número de datos o número de observaciones F Aia : Frecuencia acumulada del intervalo anterior que contiene la mediana f si si : Frecuencia simple del intervalo que contiene la mediana L sia
Para llevar a cabo este cálculo, necesitamos la frecuencia acumulada Variable 2,6 – 3,2 3,3 – 3,9 4,0 – 4,6
4,7 – 5,3 PASO Nº 1
5,4 – 6,0 6,1 – 6,7
fs 1 2 13 11 2 5
F A
1 3 16
27 29 34
Divida el número de datos entre dos (En este caso 34/2 = 17). Ubique este resultado en la columna de las frecuencias acumuladas (Recuerde que la frecuencia acumulada va sumando la cantidad de datos). En este ejercicio el intervalo es 4,7 – 5,3, Hasta el intervalo 4,0 - 4,6 sólo hay 16 datos, el dato Nº 17 se encuentra en el siguiente s iguiente intervalo
ESTADÍSTICA: PROF. JUDITH ALVARADO
26
PASO Nº 2 Localice el límite superior del intervalo anterior del dato que contiene la mediana (En este caso 4,6)
PASO Nº 3 Localice la frecuencia acumulada anterior del intervalo que contiene la mediana (En este ejercicio es 16)
PASO Nº 4 Localice la frecuencia simple del intervalo en que se encuentra la mediana (En este caso 11)
PASO Nº 5 Sustituya los datos y obtenga el resultado
M e
=
34 −16 2 4,6 + 0,7 11
= > M e
=4,66363664…. 4,66363664…. Aproxime…..
M e
= 4,7
CÁLCULO DE LA MEDIA Fórmula: x = ∑
Pm Pm . f s N
Glosario: Punto medio (se obtiene sumando los límites superior e inferior de cada clase y dividiendo entre dos). También se conoce como marcas de clase. f s : Frecuencia simple N: Número de datos u observaciones P m :
Para encontrar estos datos necesitamos el punto medio o marca de clase de cada intervalo y multiplicar el punto medio por la frecuencia simple de cada intervalo Variable
fs
P m =
Ls Ls
P m x
fs
+ Li Li 2
PASO Nº 1
2,6 3,3 4,0 4,7 5,4 6,1
– – – – – –
3,2 3,9 4,6 5,3 6,0 6,7
1 2 13 11 2 5
2,9 3,6 4,3 5,0 5,7 6,4
2,9 7,2 55,9 55,0 11,4 32,0
Calcule el punto medio o marca de clase en cada uno de los intervalos. ESTADÍSTICA: PROF. JUDITH ALVARADO
27
PASO Nº 2 En cada intervalo multiplique el punto medio por la frecuencia frecuencia simple.
PASO Nº 3 Realice la sumatoria de todos los datos encontrados y divida entre el número de observaciones 164 ,4
x
=
=>
34
x
4,835294118
=
…. Aproxime….
x
4,8
=
Después de esta explicación lo que le queda es la práctica….. Haga Haga un unos os cuat cuatro ro ejer ejerci cici cios os como como míni mínimo mo,, verá verá como como adqu adquie iere re la destreza necesaria para realizar una magnífica evaluación. MEDIDAS DE DISPERSIÓN Concepto de desviación: Las desviaciones son valores que indican en cuánto se aleja un determinado valor, de los valores de la variable; de otra forma, es la diferencia entre cada valor valor obse observ rvado ado y uno uno dete determ rmin inad ado, o, que que pued puede e ser ser la medi media a arit aritmé méti tica ca,, la mediana o un origen de trabajo elegido arbitrariamente. Analizaremos primordialmente las siguientes desviaciones: Z i '
Z i
= X i − X : Son las desviaciones con respecto a la media aritmética a ritmética X i
Ot :
Son las desviaciones con respecto a un origen de trabajo cualquiera que elijamos. =
−
Ejemplo: En la serie 2, 4, 5, 7, 12 correspondiente a las edades de un grupo de niños, hallar las desviaciones con respecto a la media aritmética: X =
2+4+5+7
+ 12
5
Desviaciones: Z 5 = 12 − 6 = 6
Z 1
=
30 5
=6
= 2 − 6 = −4
;
Z 2
= 4 − 6 = −2
;
Z 3
= 5 − 6 = −1
: :
Z 4
= 7 − 6 =1
;
Desviación media: Es la forma como se dispersan los datos con relación a la media aritmética, y se simboliza mediante las letras
D x
, se calcula como D x =
ESTADÍSTICA: PROF. JUDITH ALVARADO
∑ Z
i
N 28
En el ejercicio anterior la desviación media será
D x
=
− 4 + − 2 + −1 + 1 + 6 5
= 2,88
Los precios se dispersan en 2,88
Varianza o desviación cuadrática media: Es otro estadígrafo de dispersión básico bás ico para la obtención de la desviación típica o estándar. Su fórmula es (en datos sin agrupar) S
2
Zi =∑
2
N
El valor valor numéri numérico co de la varianz varianza a está está expres expresando ando la disper dispersió sión n en unidad unidades es dist distin inta tas s a las las de la vari variab able le,, peso pesos s al cuadr cuadrado ado,, metr metros os al cuad cuadrad rado. o. etc. etc.,, Mientras mayor es la dispersión de las observaciones, mayor es la magnitud de sus sus desv desvia iaci cion ones es resp respec ecto to a la medi media a y por por consi consigu guie ient nte e más más alto alto el valor valor numérico de la varianza.
Desviación típica o estándar: Es otro estadígrafo de dispersión, que expresa en forma más real los resultados de la varianza, ya que como vimos ésta da la dispersión en unidades al cuadrado, mien mientr tras as que que la desvi desviac ació ión n típi típica ca lo hace hace en las las unid unidade ades s orig origin inal ales es de la investigación. La desviación típica se obtiene extrayéndole la raíz cuadrada a la varianza
S =
S 2
Medidas de Dispersión ( en datos agrupados ) Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Las medid medidas as de disper dispersió sión n estudi estudia a la distri distribuc bución ión de los valore valores s de la serie, serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Exis Existe ten n dive divers rsas as medi medidas das de dispe dispersi rsión ón,, entr entre e las las más más util utiliz izad adas as pode podemo mos s destacar las siguientes: Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo
Varianza: Mide la diferencia existente entre los valores de la serie y la media. Se calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media, multiplicados por el número de veces que se ha repetido cada valor.
ESTADÍSTICA: PROF. JUDITH ALVARADO
29
La s 2
sumatoria
=∑
( xi
obtenida
se
divide
por
el
tamaño
de
la
muestra.
− x). f
N
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza más dispersos están.
El desvío estándar o desviación típica: Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media. La desviación estánd ándar puede ser interpre rprettada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es de esperarse, ya que las mediciones caen caen fuer fuera a del del rang rango o de valo valore res s de los los cual cuales es serí sería a razon razonab able le espe esperar rar que que ocurrieran si el modelo teórico fuera correcto
Desvío estándar para datos sin agrupar: Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las desviaciones de la media, pero como vimos, la suma de las desviaciones medias es igual a cero
Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raíz cuadrada del del prom promed edio io de esta estas s cant cantid idad ades es reci recibe be el nomb nombre re de desví desvío o está estánd ndar ar,, o n
desviación típica y es representada por la siguiente s iguiente fórmula:
∑ ( P m − x ) s =
2
i =1
N
La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con escalas de intervalos o razones. A mayor valor del coeficiente coeficiente del desvío desvío estándar, estándar, mayor dispersión dispersión de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia común, común, que es la media aritmétic aritmética. a. Se entiende entonces entonces que cuando cuando este valor es más pequeño, las diferencias de los valores respecto a la media, es decir, los ESTADÍSTICA: PROF. JUDITH ALVARADO
30
desv desvío íos, s, son son menor enores es y, por por lo tant tanto, o, el grup grupo o de obse observ rvac acio ione nes s es más “homogéneo” que si el valor de la desviación estándar fuera más grande. O sea que que a meno menorr disp disper ersi sión ón mayo mayorr homo homoge gene neid idad ad y a mayo mayorr dispe dispersi rsión ón,, meno menorr homogeneidad. Desviación típica o estándar para datos agrupados n
∑ ( P m − x ) s =
Pm = punto medio del intervalo. frecuencia simple
2
. f s
i =1
N x
= media aritmética
fs=
N= número de observaciones
Varianza El cuad cuadra rado do de la desv desvia iaci ción ón está estánd ndar ar reci recibe be el nomb nombre re de vari varian anza za y se representa por . La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética. Si observamos, veremos que la varianza no es más que el desvío estándar al cuadrado. Precisamente la manera de simbolizarla es
.
Por lo mismo, el desvío estándar puede definirse como la raíz cuadrada de la varianza
El coeficiente de variación: Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación
ESTADÍSTICA: PROF. JUDITH ALVARADO
31
(Las barras del denominado denominadorr representan representan el valor absoluto, absoluto, es decir, indican indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de varia variaci ción ón consi conside dera rare remo mos s que que la dist distri ribu buci ción ón de la varia variabl ble e medi medida da es más más homogénea.
MEDIDAS DE POSICIÓN CUANTILES: Constituyen una familia a la cual pertenecen los cuartiles (dividen la serie de dato datos s en cuat cuatro ro porc porcio ione nes s igual guale es en térm térmiinos nos de la prop propor orci ción ón de observaciones de cada una de ellas), los deciles (dividen la serie de datos en diez porciones iguales en términos de la proporción de observaciones) y los percentiles (dividen la serie de datos en cien porciones iguales en términos de la proporción de observaciones).
Cuartiles: Son Son 3 valo valore res s que que dist distri ribu buye yen n la seri serie e de dato datos, s, orde ordena nada da en form forma a creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Fórmulas para el cálculo en datos agrupados: 2 N − Fa N − Fa 3 N − Fa Fa ia Fa ia Fa ia ; Q 3 = Ls ; Q 2 = Ls Ls ca + ic 4 Ls ca + ic 4 Ls ca + ic 4 Q1 = Ls fs i fs i fs i
Deciles: Son Son 9 valo valore res s que que dist distri ribu buye yen n la seri serie e de dato datos, s, orde ordena nada da en form forma a creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. N 2 N − Fa Fa ia Fa ia − Fa etc., etc., ; D 2 = Ls Ls ca + ic 10 Ls ca + ic 10 D1 = Ls fs i fs i
Percentiles: Son Son 99 valor valores es que que dist distri ribu buye yen n la seri serie e de dato datos, s, orde ordenad nada a en form forma a creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. Pn =
Ls ca
n +ic 100
. N − Fa ia fs i
, donde n es el valor del percentil, ic, es el intervalo de
clas clase; e; N el núme número ro de obse observ rvac acio ione nes, s, Fa ia es la frec frecue uenc ncia ia acum acumul ulada ada del del intervalo anterior y fs i es la frecuencia simple del intervalo. Para proceder a su cálculo se procede de la siguiente forma: ESTADÍSTICA: PROF. JUDITH ALVARADO
32
Calcule la posición en la que se encuentra el valor posicional pedido en el ejercicio por ejemplo si es el tercer cuartil aplique la fórmula de cálculo del tercer cuartil ( se realiza de la misma manera si es decil o percentil) Q3
= 3. N , 4
Se ubica con las frecuencias acumuladas la posición en la que se encuentra y se aplica la fórmula., Límite superior anterior al intervalo en que se encuentra el valor que calculamos mas el intervalo de clase multiplicado por el valor posicional buscado menos la frecuencia acumulada anterior al intervalo en que se encuentra el valor dividido entre la frecuencia simple del intervalo. Veamos un ejemplo:
Clases f a 35 - 10 39 40 - 15 44 45 - 20 49 50 - 30 54 55 - 25 59 60 - 15 64 65 - 5 69 Cálculo de posición del primer cuartil
Q1
= Ls
ca
N − Fa + ic 4 fs i
ia
F A
10 25 45 75 10 0 11 5 12 0
Ubiquemos el primer cuartil
Q1
= 120 ; 4
Q1
= 30 ; el
primer cuartil está ubicado en la clase que contiene el dato número 30, en este caso se encuentra en la clase 45-49. El intervalo de clase es 5 (se obtiene restando dos límites consecutivos)
30 − 25 = 45,25 20
Sustituyendo en la fórmula Q1 = 44 + 5
El 25% de los datos se encuentra por debajo de 45,25
NOTA: Impo Import rtant ante e es ubic ubicar ar bien bien la clas clase e en la que que se encu encuen entr tra a el valor valor posicional pedido
ESTADÍSTICA: PROF. JUDITH ALVARADO
33
INTERPRETACIÓN INTERPRETACIÓ N DE MEDIDAS DE POSICIÓN Primer cuartil (Q1 ) . Valor del conjunto de datos por debajo del cual está el 25% de los datos, coincide con el percentil 25 Segundo cuartil (Q 2 ) Valor del conjunto de datos por debajo del cual está el 50% de los datos, coincide con el percentil 50 y con la mediana Tercer cuartil (Q3 ) Valor del conjunto de datos por debajo del cual está el 75% de los datos, coincide con el percentil 75
Rango intercuartílico: El rango intercuartílico RI es, sencillamente, la diferencia entre el tercer y el primer cuartil, es decir
Esto nos dice en cuántas unidades de los valores que toma la variable se concentra el cincuenta por ciento central de los casos. Ejercicio: Dado Dados s los los sigu siguie ient ntes es datos datos agru agrupa pado dos, s, indi indiqu que: e: varia varianz nza, a, desvi desviac ació ión n típi típica ca,, coeficiente de variabilidad, coeficiente de Pearson, indique el tercer cuartil, el percentil 28. Interprete los resultados del cuartil y el percentil pedidos 11,4 - 11,8 3 11,9 - 12,3 9 12,4 - 12,8 10 12,9 - 13,3 8 13,4 - 13,8 6 13,9 - 14,3 4 Fórmulas: Media x =
Pm . f ∑ Pm ;
Varianza s
( Pm Pm − x ) . f ; =∑
Desviación media
N
D x =
Pm − x . f N
,
2
2
N
Desviación típica s =
Coeficiente de variabilidad; CV=
s 2
;
s x
Coeficiente de Pearson Pearson CP= CV x100 3n − Fa n . N − Fa Fa ia 4 1 0 0 + L s i c + Ls ca ic Q 3 = Ls ; Pn = fs fs i 2.- Una pareja quiere tener tener tres hijos ¿Cuál es la la probabilidad de que salgan 2 hembras y un varón? Determine su respuesta con un diagrama de árbol (3 puntos) ¿Cómo se calcula cada uno de los valores va lores pedidos en el ejercicio? 1.- Se calcula el punto medio de cada una de las clases. ia
ca
i
ESTADÍSTICA: PROF. JUDITH ALVARADO
34
2.- Se multiplica el valor encontrado por la frecuencia simple 3.- Se realiza la sumatoria (Se encuentra la media aritmética en datos agrupados) 4.- Se calcula el punto medio menos la media aritmética multiplicado por la frecuencia simple(la suma del valor absoluto de todas estas diferencias dividida entre el número de datos te da la desviación media) 5.- Se eleva el valor encontrado en el paso Nº 4 al cuadrado 6.- Se multiplica el valor encontrado en el paso 5 por la frecuencia simple 7.- La suma de todos los valores del paso 5 dividida entre el número de observaciones te da la varianza 8.- Se calcula la raíz cuadrada de la varianza y te da la desviación típica 9.- Se divide la desviación típica entre la media aritmética y te da el coeficiente de variabilidad (toma 4 decimales) 10.- Se multiplica multiplica el coeficiente coeficiente de variabilidad por 100 y te da el coeficiente de Pearson.
CÁLCULO DE LOS CUARTILES O PERCENTILES Creo que la explicación está completa en la guía
TEORÍA DE PROBABILIDAD La probabilidad clásica está caracterizada porque en todo experimento se conocen los resultados posibles. El estudio de la probabilidad se relaciona con fenómenos aleatorios. Aunque no podemos estar seguros de si ocurrirá o no un resultado dado podemos obtener una buena medida de su verosimilitud o probabilidad. En el estudio de la probabilidad, diremos que cualquier observación o medida de un fenómeno aleatorio es un experimento. Los efectos posibles del experimento se denominan resultados, resultados, el conjunto conjunto de todos los resultados resultados posibles se conoce conoce como como espaci espacio o muestr muestral, al, a cualqu cualquie ierr subcon subconjun junto to del espaci espacio o muestr muestral al se le conoce como evento. Los Los resu result ltado ados s que que pert perten enec ecen en al even evento to gene general ralme ment nte e se cono conoce cen n como como “resultados favorables o éxitos”. Cada vez que se observa un éxito decimos que ocurrió el evento. Los eventos se determinan en forma empírica ( de manera experimental) o teóricamente. Ejemplo. Se lanza una moneda al aire, determine la probabilidad que salga cara Resp. S { c,s } ( resultados posibles )
P ( E )
= n( E ) n ( S )
P E
número =
resultados
número
de
E = { c } ( resultados favorables ) favorables
resultados
ESTADÍSTICA: PROF. JUDITH ALVARADO
del
suceso
posibles 35
Cuando se lanza una moneda este representa un experimento estadístico, en el cual se conocen un número total de resultados posibles, o sea, cara o sello, en el cual esperamos que cada resultado tenga igual probabilidad de ocurrir P (cara )
=
1 2
0,5
y en forma de porcentaje 50%
Ejercicios: Un juego uego de carta artas s españ spañol olas as tien tiene e 40 carta artas, s, 7 con núm números eros que que conocemos como as, dos, tres, cuatro, cinco, seis, siete, y 3 con figuras sota (10) caballo(11) y rey (12), además tiene 4 formas oro, bastos, copas y espadas, así tendremos 10 de cada palo diferente.. a) ¿Cuál es la probabil probabilidad idad de que al sacar sacar una carta cualqui cualquiera era salga una de oro? b) ¿Qué salga una carta carta menor menor de 6? 6? c) ¿Qué ¿Qué salg salga a una una figur figura? a? d) ¿Qué ¿Qué sal salga ga un un as? as?
Espacio muestral: Se llama espacio muestral al conjunto formado por todos los resultados posibles del experimento, este conjunto lo designaremos por E Ejemplo: Sea el experimento de lanzar simultáneamente dos monedas, entonces el espacio muestral es los cuatro posibles resultados de este experimento Primera moneda Segunda moneda C - S C - S E = { cc, cs, sc, ss} Para visualizarlo se construye un diagrama de árbol C C
C S
S S Ejercicios: 1.-C 1.-Car arme men n quie quiere re tene tenerr exac exacta tame ment nte e 2 niña niñas s en 3 emba embara razo zos, s, calc calcul ule e la probabilidad de lograrlo. Construya un diagrama de árbol y un cuadro de eventos. 2.- En un año recien reciente te los nacimi nacimient entos os en la Matern Maternida idad d concep concepció ción n Palaci Palacios os incl incluí uían an en un mes mes a 1.61 1.613 3 homb hombre res s y 1.53 1.531 1 muje mujere res. s. Si una una pers person ona a fue fue sele selecc ccio ionad nada a de mane manera ra alea aleato tori ria a de los los regi regist stro ros s de ese ese mes mes ¿Cuá ¿Cuáll es la probabilidad de que salga un varón?, ¿Y que sea una hembra? 3.- Tenemos una caja con 3 metras negras, 2 rojas y 6 blancas ¿Cuál es la probabilidad de que al sacar una metra sea roja? ¿Sea blanca? ¿Sea negra?
ESTADÍSTICA: PROF. JUDITH ALVARADO
36
4.- Se lanza una moneda 4 veces, determinar la probabilidad de obtener 3 caras y un sello. Este es el contenido del segundo parcial…… Es para trabajarlo….. Ah…. El próximo taller que vale el 13% de su nota…..
ESTADÍSTICA: PROF. JUDITH ALVARADO
37
EXÁMENES DEL PRIMER CORTE 1.- Dados los siguientes datos agrupados, calcule media, mediana y moda Pm Pm . f s 52,6 – 1 Fórmulas: (media); Moda x = 53,2 N 53,3 – 2 f p Mo = L sia + ic 53,9 f p + f a 54,0 – 13 n − f 54,6 2 De los resultados en décimas. M d = L + i c 54,7 – 11 Mediana fs 55,3 55,4 – 2 66,0 56,1 – 5 2.- Los siguientes datos corresponde al peso en gramos de 56,7 muestras de enlatados. Encuentre media, mediana y moda. Agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados.
∑
Aia
sia
19.12 22.43 18.41 28.60 28.55 20.71 30.20 19.45 26.40 19.60 22.50 27.45 26.90 20.70 20.20 23.65 20.95 24.60 25.30 18.31 30.94 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n 92,6 93,1 93,2 93,7 93,8 94,3 94,4 94,9 95,0 95,5 95,6 96,1
–
3
–
5
–
Fórmulas: x =
12 13
–
1
–
6
20.75 28.88
1.- Dados los siguientes datos agrupados, calcule media, mediana y moda
Mo
–
22.90 19.70
f p = L sia + ic f p + f a Mediana
Pm . f ∑ Pm
s
N
(media) Moda
Md
= L sia
n − f Aia + ic 2 fs i
De los resultados en
décimas
2.- Dados los siguientes datos que corresponden a un grupo de pesos de niños, calcule media, mediana y moda. Agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados. 2.98 3.84 2.88 3.96 4.02 5.14 3.50 2.97 3.95 1.95 2.80 3.92 4.00 2.60 2.80 2. 80 1.96 3.50 2.90 2. 90 4.50 3.03 2.80 3.90 4.05 5.15 3.50 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n ESTADÍSTICA: PROF. JUDITH ALVARADO
38
2,61 – 7,90 7.91 13.20 13,2118,50 18,5123,80 23,8129,10 29,1134.40
1 2
1.- Dados los siguientes datos agrupados, calcule media, mediana y moda Fórmulas: x =
13
= L sia
Pm . f ∑ Pm
f p + ic f p + f a
s
(media);
N
Mediana
11
Mo
2
resultados en centésimas.
Md
= L sia
Moda n − f Aia + ic 2 fs i
De los
2.- Los siguientes datos corresponde al peso en gramos de muestras de enlatados. Encuentre media, mediana y moda. Agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados. 5
19.1 22.4 18.4 28.6 28.5 20.7 30.2 22.9 20.7 22.5 27.4 26.9 20.7 20.2 19.7 28.8 23.6 20.9 30.9 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n 6,26 6,31 6,32 6,37 6,38 6,43 6,44 6,49 6,50 6,55 6,56 6,61
–
3
–
5
–
1.- Dados los siguientes datos agrupados, calcule media, mediana y moda Fórmulas: x =
12 Mo
–
13
–
3
–
6
19.4 26.4 19.6 24.6 25.3 18.3
f p = L sia + ic f p + f a Mediana
Pm . f ∑ Pm
s
N
(media) Moda
Md
= L sia
n − f Aia + ic 2 fs i
De los resultados en
centésimas 2.- Dados los siguientes datos que corresponden a un grupo de pesos de niños, calcule media, mediana mediana y moda. Agrupe según la la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados. 2.9 1.9
3.8 2.8 3.9 4.0 5.1 3.5 2.9 3.9 1.9 2.8 3.9 4.0 2.6 2.8 3.5 2.9 4.5 3.0 2.8 3.9 4.0 5.1 3.5 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n 22,60 – 1 23,34 23,35 – 2 1.- Dados los siguientes datos agrupados, calcule media, 24,09 mediana y moda 24,10 – 14 24,84 24,85 – 12 25,59 ESTADÍSTICA: PROF. JUDITH ALVARADO 39 25,60 – 2 26,34 26,35 – 5 27,09
Fórmulas: x = Mediana
Md
Pm . f ∑ Pm
= L sia
f
p (media) Moda Mo = L sia + ic N f p + f a n − f Aia + ic 2 fs i De los resultados en centésimas
s
2.- Dados los siguientes que corresponde al peso en kilos de jamón datos indique: media, mediana y moda, agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados. 9.9 9.7 9.4 8.0 9.6 10.2 10.6 9.9 9.7 9.0 8.2 7.4 7.2 8.3 10.7 11.2 9.2 8.0 10.8 10.6 10.6 8.4 6.5 11.0 8.4 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n
2,61 – 7,90 7.91 13.20 13,2118,50 18,5123,80 23,8129,10 29,1134.40
3 6
1.- Dados los siguientes datos agrupados, calcule media, mediana y moda Fórmulas: x =
13
= L sia
Pm . f ∑ Pm
f p + ic f p + f a
s
N
(media);
Mediana
11
Mo
5
resultados en centésimas.
Md
= L sia
Moda n − f Aia + ic 2 fs i
De los
2
2.- Los siguientes datos corresponde al peso en gramos de muestras de enlatados. Encuentre media, mediana y moda. Agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados.
19.1 22.4 18.4 28.6 28.5 20.7 30.2 22.9 20.7 22.5 27.4 26.9 20.7 20.2 19.7 28.8 23.6 20.9 30.9 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n
19.4 26.4 19.6 24.6 25.3 18.3
6,26 – 3 1.- Dados los siguientes datos agrupados, calcule media, 6,31 mediana y moda 6,32 – 5 Pm Pm . f s Fórmulas: (media) Moda x = 6,37 N 6,38 – 14 f p 6,43 Mo = L sia + ic f p + f a 6,44 – 10 6,49 6,50 – 6 6,55 ESTADÍSTICA: 40 6,56 – 2 PROF. JUDITH ALVARADO 6,61
∑
n − f Aia Md = L sia + ic 2 Mediana fs i De los resultados en centésimas 2.- Dados los siguientes datos que corresponden a un grupo de pesos de niños, calcule media, mediana y moda. Agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados.
2.9 3.8 2.8 3.9 4.0 5.1 3.5 2.9 3.9 1.9 2.8 3.9 4.0 1.9 3.5 2.9 4.5 3.0 2.8 3.9 4.0 5.1 3.5 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n
2.6
2.8
1.- Dados los siguientes datos agrupados, calcule media, 22,60 – 3 mediana y moda 23,34 23,35 – 5 24,09 f p Pm Pm . f s = + Mo L ic Fórmulas: (media) Moda x = sia 24,10 – 14 + f p f a N 24,84 n − f 24,85 – 10 Aia 2 De los resultados en centésimas = + M d L ic Mediana sia 25,59 fs i 25,60 – 6 26,34 2.- Dados los siguientes que corresponde al peso en kilos de 26,35 – 2 jamón datos indique: media, mediana y moda, agrupe según la 27,09 regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados. 9.8 9.7 9.3 8.7 9.6 10.6 10.4 9.9 9.7 9.0 8.2 7.4 7.2 8.3 10.7 11.2 9.2 8.0 10.8 10.6 10.6 8.4 6.5 11.0 8.4 n = 1+3,22.log N; R= Vmax – V min; Ic = R/n
∑
52,6 53,2 53,3 53,9 54,0 54,6 54,7 55,3 55,4 66,0 56,1 56,7
–
2
–
4
–
13
–
11
–
7
–
3
Fórmulas: x = Mediana
Md
Pm . f ∑ Pm
= L sia
s
N
(media);
n − f Aia +ic 2 fs
f
p Moda Mo = L sia + ic f f + a p
De los resultados en décimas.
2.- Los siguientes datos corresponde al peso en gramos de muestras de enlatados. Encuentre media, mediana y moda. Agrupe según la regla de Sturges. Elabore una tabla de frecuencias, un diagrama circular e interprete los resultados.
19.12 22.43 18.41 28.60 28.55 20.71 30.20 19.45 26.40 19.60 22.50 27.45 26.90 20.70 20.20 23.65 20.95 24.60 25.30 18.31 30.94 ESTADÍSTICA: PROF. JUDITH ALVARADO
22.90 19.70
20.75 28.88 41
n = 1+3,22.log N;
R= Vmax – V min;
ESTADÍSTICA: PROF. JUDITH ALVARADO
Ic = R/n
42