Estatística Descritiva 2º semestre de 2008 – Gabarito Exemplos 1 Resolva os exercícios a seguir manualmente, manualmente, apresentando todos os cálculos. Exercício 01
Os dados a seguir foram obtidos em indivíduos contaminados pelo veneno de um certo tipo de inseto e submetidos submetidos a tratamento. tratamento. A variável variável de interesse interesse Recup é definida definida como como o tempo (em horas) entre a administração do tratamento e a recuperação do indivíduo. Os valores de Recup são os seguintes: 3, 90, 23, 46, 2, 42, 47, 37, 12, 51, 11, 1, 3, 3, 45, 3, 4, 11, 2, 8, 56, 39, 22, 16, 5 e 52. (a) Determine a média, mediana, intervalo inter-quartil e desvio padrão. 26
Media =
X
=
X 1
+ X2 +L +
X 26
26
∑ X
i
=
i 1 =
26
=
(3 + 90 + ... + 52)/26 = 24,38
Mediana: valor que deixa 50% das observações ordenadas à sua esquerda. Com os dados ordenados, a observação que ocupa a “posição” (26+1)/2=13,5 será a mediana. Portanto será a média entre os elementos que ocupam as posições 13 e 14. Posições
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
Valores ordenados
1
2
2
3
3
3
3
4
5
8 11 11 11 12 16 22 23 23 37
39 42 45 46 47 51 52 56 90
Mediana= (12+16)/2=14 Intervalo Inter-quartil: Q 1: valor que deixa 25% das observações ordenadas à sua esquerda. Com os dados ordenados, é o elemento que ocupa a “posição” 0,25 (26+1)=6,75 sendo portanto a média entre a 6ª e a 7ª observação. 1º quartil=(3+3)/2=3 Q 3: valor que deixa 75% das observações ordenadas à sua esquerda. Com os dados ordenados, é o elemento que ocupa a “posição” 0,75(26+1)=20,25. Portanto é a média entre o 20º e o 21º elemento. 3º quartil= (45+46)/2=45,5 Portanto, intervalo inter-quartil = Q 1 – Q 3 = 45,5 – 3 = 42,5 (Para (Para estes cálculos podem usar a formula exata dada em sala) sala) Desvio padrão: Temos que a variância pode ser obtida pela seguinte fórmula: n
Var =
S2 =
∑ X
2 i
− n( X )2
i 1 =
n −1
Assim, desvio padrão = S =
=
2
S
(32 + ... .... + 522 ) − 26(24 (24,38 ,38) 2 =555,61 25
=
555,61 =23,57
Página 1 de 5
Estatística Descritiva 2º semestre de 2008 – Gabarito Exemplos 1
(b) Separe o conjunto de dados em três grupos denominados cura rápida, com valor de Recup menor ou igual a 12, cura normal, se o valor de Recup for maior do que 12 e menor ou igual a 45, e cura lenta, se o valor de Recup estiver acima de 45. Compare a variabilidade desses três grupos através
de seus coeficientes de variação.
Cura rápida Cura normal Cura lenta
Média
DP
CV (%)
5,23 32,00 57,00
3,88 11,40 16,56
74,19 35,62 29,05
Os cálculos foram obtidos da seguinte maneira: Médias:
Media da Cura rápida = (1+2+2+3+3+3+3+4+5+8+11+11+12)/13 = 5,23 Média da Cura normal = (16+22+23+37+39+42+45)/7 = 32 Média da Cura lenta = (46+47+51+52+56+90)/6 = 57 Desvio Padrão (s) n
∑ X
Desvio Padrão da Cura rápida =
2 i
− n( X )2
i 1
=
=
n −1
(12 + .... + 122 ) − 13(5,23)2 =3,88 12
n
∑ X
Desvio Padrão da Cura normal =
2 i
− n( X )2
i 1
=
=
n −1
(162 + .... + 452 ) − 7(32) 2 =11,40 6
n
∑ X
Desvio Padrão da Cura leta =
2 i
− n( X )2
i 1 =
n −1
=
(462 + .... + 902 ) − 6(57)2 =16,56
Coeficiente de Variação (CV) s
CV da cura rápida =
X
CV da cura normal =
CV da cura lenta =
*100 =
s X
s X
*100 =
*100 =
3,88 5,23
*100 =74,19%
11,40 32
16,56 57
*100 =35,62%
*100 =29,05%
Página 2 de 5
5
Estatística Descritiva 2º semestre de 2008 – Gabarito Exemplos 1 Em relação às médias, a variabilidade do grupo cura rápida é maior que a dos demais grupos. O grupo cura lenta apresentou a menor variabilidade. Exercício 02
Um órgão do governo do estado está interessado em determinar padrões sobre o investimento em educação, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) da tabela abaixo: Cidade A B C D E F G Investimento 25 16 14 10 19 15 19 (a) Calcule a média das observações. (1,0)
H I J 16 19 18
10
Média =
X
=
X 1
+ X2 +L +
X 10
10
∑ X
i
=
i 1 =
10
=
X
=
25 + ... + 18 10
= 17,1
(b) Receberão um programa especial as cidades com valores de investimento inferiores à média menos duas vezes o desvio padrão. Alguma cidade receberá o programa? (1,5) Média
DP
2DP
Média - 2DP
Média + 2DP
17,1
3,96
7,92
9,18
25,02
Nenhuma cidade receberá o programa especial, pois nenhuma cidade apresentou valor de investimento inferior a 9,18. O desvio padrão foi calculado da seguinte maneira: n
s=
s
2
=
∑ X
2 i
− n( X )2
i 1 =
n −1
=
(252 + .... + 182 ) − 10(17,1)2 9
(c) Será considerado como investimento básico a média das observações compreendidas entre a média
original menos dois desvios padrão e a média original mais dois desvios padrão. Calcule o investimento básico e compare com a média obtida no item a). Justifique a diferença encontrada. Investimento básico=(25+16+14+10+19+15+19+16+19+18)/10=17,1 O investimento básico é igual à média obtida no item (a).
Página 3 de 5
Estatística Descritiva 2º semestre de 2008 – Gabarito Exemplos 1 Exercício 03
As concentrações de óxido de nitrogênio e hidrocarbono (em µg/m3) foram determinadas em uma área urbana, em locais e horários específicos. Os dados são mostrados a seguir. Dia
Óxido de Nitrogênio (O)
1 2 3 4 5 6 7 8 9 10 11
104 116 84 77 61 84 81 72 61 97 84
Hidrocarbono (H) 108 118 89 71 66 83 88 76 68 96 81
DIF= O – H -4 -2 -5 6 -5 1 -7 -4 -7 1 3
(a) Classifique as variáveis em estudo.
Óxido de Nitrogênio: quantitativa contínua Hidrocarbono de Nitrogênio: quantitativa contínua (b) Realize uma análise descritiva dos dados. Calcule média e desvio padrão para cada variável e para
a variável DIF = O - H (diferença entre as concentrações dos poluentes).
Variável
O H DIF = O - H
Média ( X )
Desvio Padrão (s)
83,73 85,82 -2,09
16,89 16,44 4,28
Os cálculos das médias e dos desvios padrões estão apresentados a seguir. Médias:
Media de O = (104+...+84)/11 = 83,73 Média de H = (108+...+81)/11 = 85,82 Média de DIF=O-H = (-4+...+3)/11 = -2,09
Desvio Padrão (s)
Página 4 de 5
Estatística Descritiva 2º semestre de 2008 – Gabarito Exemplos 1 n
Desvio Padrão de O =
∑ X
2 i
− n( X )2
i 1 =
n −1
(1042 + .... + 842 ) − 11(83,73) 2 =16,89
=
10
n
Desvio Padrão de H =
∑ X
2 i
− n( X )2
i 1 =
n −1
(1082 + .... + 812 ) − 11(85,82) 2 =16,44
=
10
n
Desvio Padrão de DIF =
∑ X
2 i
− n( X ) 2
i 1 =
n −1
=
((−4)2 + .... + 32 ) − 11( −2,09)2 =4,28 10
(c) Considerando a variável DIF, pode-se dizer que as duas classes de poluentes estão presentes nas
mesmas concentrações?
Considerando a variável DIF, pode-se dizer que a variável O apresenta uma concentração média menor que a variável H.
Página 5 de 5