Contenido Primer Parcial Estadistica I 1501
Contenido Primer Parcial Estadistica I 1501
Contenido Primer Parcial Estadistica I 1501
Usamos las tablas de frecuencias con datos agrupados cuando la variable toma
un gran número de valores o es una variable continua. Para ello, se agrupan los
diferentes valores en intervalos de igual amplitud, a los cuáles llamamos clases.
Por ejemplo:
Las VARIABLES son las características de los individuos que se quieren estudiar
y pueden tomar distintas modalidades o valores.
Es importante distinguir entre los distintos tipos de datos con los que podemos
tratar. Sus diferencias determinan la selección y aplicación de las técnicas
estadísticas
Frec.
Frecuenci Frec. Frecuenci
Autos Frecuenci porcentua
a Frecuenci relativa a
vendido a l
acumulad a relativa acumulad porcentua
s absoluta acumulad
a a l
a
Total
Total
Ejercicio:
0.43 1.50 2,05 2,58 2,86 2,93 3,90 4,38 4,46 5,11 5,23
5,36 5,44 5,54 6,08 6,12 6,36 6,39 6,48 6,51 6,88 7,31
7,34 8,06 8,10 8,20 8,21 8,23 8,34 8,56 8,64 8,73 8,73
8,73 8,73 8,74 8,88 8,90 8,93 9,14 9,25 9,56 9,68 9,85
9,87 9,94 9,99 10,06 10,11 10,24 10,26 10,51 11,23 11,60 11,63
11,64 11,85 11,92 12,34 12,78 12,94 13,05 13,18 13,31 13,48 13,88
14,05 14,15 14,23 14,24 14,30 14,55 14,59 15,42 15,45 15,71 16,07
16,54 16,84 17,04 19.39
Pasos a desarrollar:
En este caso:
Número de clases= 9
a = Recorrido/ no de clases
3. Construir la clase:
El valor menor de la variable es 0.43, por lo que el límite inferior del primer
intervalo puede fijarse en 0.
Por último, se tiene que indicar si los intervalos son abiertos o cerrados.
Por omisión, se interpreta que los intervalos son (Li-1, Li] cerrados por la derecha:
Preguntas de análisis:
0-2
2-4
4-6
6–8
0-2
3-5
6-8
9 – 10
Limites reales
Forma N.2:
Los límites reales: son valores que unen a las clases y se forman únicamente de
números enteros, estos se obtienen al restar 0.5 a los límites de la izquierda y
sumar 0.5 a los límites de la derecha; cuando las clases tengan un decimal,
habrá que restar 0.05 a los límites de la izquierda y sumar 0.05 límites de la
derecha y así sucesivamente.
Representación grafica
Gráficas
Cuando se desea dar a conocer la forma en la que se distribuyen los datos, éstos
se presentan en una o varias gráficas. Las más importantes son 3 que son:
Histograma
Polígono Frecuencias
Histograma
Es una gráfica de barras rectangulares cuyas bases están centradas en la marca
de clase del intervalo, y sus áreas son proporcionales a la frecuencia del intervalo.
Es importante señalar que las distancias entre marcas de clase son siempre las
mismas, por lo que la condición de que las áreas de los rectángulos sean
proporcionales a las frecuencias, se convierte en la altura proporcional a la
frecuencia.
25
20
Histograma de Frecuencias
Poligono de Frecuencias
15
10
0
1 3 5 7 9 11 13 15 17 19
Polígono de Frecuencias
Ojiva
La ojiva es también una gráfica poligonal, pero se dibuja utilizando las fronteras
contra las frecuencias acumuladas(o acumuladas relativas).La ojiva indica, para
cada frontera, los elementos(o proporción de elementos), que son menores o
Media aritmética
Media ponderada
Media geométrica
Media armónica
Mediana
Moda
La media aritmética
Niño Nota
1 6.0
2 5.4
3 3.1
4 7.0
5 6.1
6.0+5.4+3.1+7.0+6.1 = 27.6
Definición:
Propiedades:
Inconvenientes de su uso
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada.
Si son nuestros datos y son sus "pesos"
respectivos, la media ponderada se define de la siguiente forma:
Media muestral
Moda
Por último, si todas las variables tienen la misma frecuencia diremos que no
hay moda.
Propiedades
Cálculo sencillo.
Inconvenientes
Su valor es independiente de la mayor parte de los datos, lo que la hace
muy sensible a variaciones muestrales. Por otra parte, en variables
agrupadas en intervalos, su valor depende excesivamente del número de
intervalos y de su amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
Puede haber más de una moda en el caso en que dos o más valores de la
variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).
Mediana
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En
nuestro ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo
que Me = 5 puntos (es aconsejable no olvidar las unidades; en este caso como
estamos hablando de calificaciones, serán puntos)
Ejemplo (n par)
Calificaciones 1 2 3 4 5 6 7 8 9
Calificaciones Frecuencia absoluta Frecuencia acumulada
variable xi Número de falumnos
i 2 2 4 5 6 9 4 4 Fi
2
1 2 2
2 2 4
3 4 8
4 5 13
5 6 19 = 19
6 9 28
7 4 32
8 4 36
9 2 38
Con lo cual la mediana será la media aritmética de los valores de la variable que
ocupen el decimonoveno y el vigésimo lugar.
Propiedades e inconvenientes
Marc
Frecuenci
Clase a de
a absoluta FM
s clase
F
M
[10,
15 1 15
20)
[20,
25 8 200
30)
[30,40) 35 10 350
[40,
45 9 405
50)
[50, 60 55 8 440
[60,70) 65 4 260
42 1 820
La media: Σ FM
ΣF
Es el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor.
Dónde:
Ejemplo
Calcular la mediana de una distribución estadística que viene dada por la siguiente
tabla:
Frecuenci
Frecuenci a
Clase a absoluta acumulad
s a
fi
Fi
[60,
5 5
63)
[63,
18 23
66)
[66,
42 65
69)
[69,
27 92
72)
[72, 8 100
100
100 / 2 = 50
Clase modal: [66, 69)
Dónde:
Ejemplo: Calcular la moda de una distribución estadística que viene dada por la
siguiente tabla:
Clase Frecuencia
[60,
5
63)
[63,
18
66)
[66,
42
69)
[69,
27
72)
[72,
8
75)
100
Ejemplo
fi hi
[0, 5) 15 3
[5, 7) 20 10
[7, 9) 12 6
[9, 10) 3 3
50
El rango
La varianza
La desviación típica y
El coeficiente de variación.
Rango
R = Máxx – Mínx
Dónde:
Varianza
Datos agrupados
Datos no agrupados
Datos agrupados
Coeficiente de variación
Ejercicio
a = Recorrido/ no de clases
Se pide:
Dónde:
11
La mediana: 1,136.36
Dónde:
La moda: L MOD + Da .I
Da + Db
La moda: 954.54
Da: 12 – 2 : 10
Db: 12 – 11 : 1
Dónde:
L MOD: Límite inferior de la clase modal.
Coeficiente de Variación: S
Ejercicio Propuesto:
77 18 63 84 38 54 50 59 54 56
41 58 58 53 51 62 43 52 53 63
60 60 45 66 83 71 63 58 61 71
36 26 50 34 44 62 62 65 61 52
Calcule:
a) La media aritmética
b) La mediana
c) La moda
d) Las medidas de dispersión
Media Geométrica
Ejercicio:
Obsérvese que para obtener el precio del primer año (tras una subida del 10%),
tenemos que multiplicar por 1,1 el precio inicial.
Al precio así obtenido tenemos que multiplicarlo por 1,2 (subida del 20%) para
obtener el precio tras el segundo año. Y a dicho precio hemos de multiplicarlo por
1,3 (subida del 30%) para obtener el precio final. Así si el precio inicial es 100, el
resultado final será:
Ejercicio propuesto:
La media ponderada difiere de la media aritmética en que cada dato tiene mayor o
menor importancia o peso a la hora de calcular la media.
Ejercicio:
Para simplificar los cálculos, utilizamos los pesos normalizados (dividiendo cada
peso entre 100):
La media ponderada es mayor que la media aritmética porque las dos notas altas
tienen más peso que la otra.
Ejercicio:
El alumno Santiago López obtuvo las siguientes notas durante los cuatro
bimestres:
Bimestre Calificación
1º Bimestre 9.0
2º Bimestre 8.5
3º Bimestre 7.0
4 ° Bimestre 6.0
(9 x 1) + (8.5 x 2) + (7 x 3) + (6 x 4)
1+2+3+4
Media Ponderada = 9 + 17 + 21 + 24
10
Ejercicio Propuesto:
President
1 $ 15.000,00
e
Director 3 8.500,00
Gerente 3 6.000,00
Secretario 3 2.500,00
Aprendiz 6 1.500,00