Estadística Aplicada A La Eduacación. L Y L
Estadística Aplicada A La Eduacación. L Y L
PROGRAMA DE ASIGNATURA
I Año.
OBJETIVOS ESPECÍFICOS.
Conceptual:
Analizar mediante seminario los conceptos y características de la Estadística a fin de que reconozcan la
importancia de aplicarla en el campo educativo.
Procedimental:
Observar los tipos de estadísticas mediante trabajo investigativo con el objetivo que diferencien los datos
estadísticos cualitativos y cuantitativos.
Actitudinal:
Mostrar interés en la estadística mediante la participación en debates y mesas redondas con la finalidad
de que aprecien la importancia de la misma en la toma de decisiones para la resolución de problemas.
Contenido Temático:
1. ¿Qué es Estadística?: 1.1 Conceptos básicos 1.2 Organización de datos
1.3 Antecedentes 1.4 Características 1.5 Fundamentos filosóficos
1.6 Fundamentos básicos. 1.7 Importancia en su ejecución
2. Tipos de Estadísticas: 2.1 Cualitativas. 2.2 Cuantitativa.
3. Teoría de la probabilidad.
4. Muestreos e inferencia estadística .
1. ¿Qué es Estadística?
Al término Estadística se le asignan diversas acepciones por parte de las personas
vinculadas al campo socioeducativo; así se puede entender como una serie de conjuntos
de números, como método de trabajo propio del campo empírico, como a la forma de
resolver problemas educativos, e incluso, a considerarla como una ciencia.
Entendida como conjunto de datos numéricos propia de los censos de personas que se
ubican en un determinado espacio físico, podemos reseñar las estadísticas sobre los
niveles de escolarización obligatoria, sobre el acceso a los estudios superiores de los
inmigrantes, etc. Desde el otro extremo, al considerarla como ciencia, dirige su atención
al estudio de los fenómenos aleatorios, con este enfoque se ha conseguido avanzar en
el desarrollo de métodos, técnicas y modelos que nos ayudan en la resolución de
problemas pedagógicos y, sobre todo, a la toma de decisiones. La Estadística actúa
como una disciplina puente entre los modelos matemáticos y los fenómenos reales, que,
además, proporciona una metodología para evaluar las discrepancias entre la realidad y
la teoría.
Entre los autores que han definido la Estadística, quizá una de las más completas y
comprensibles nos la ofrece Kerlinger (1985) cuando la define como:
¿Qué es la estadística?
La Estadística estudia los métodos y procedimientos para recopilar, organizar, presentar
y analizar datos, siempre y cuando la variabilidad e incertidumbre sea una causa
intrínsica de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad
de ayudar a la toma de decisiones y en su caso formular predicciones.
Población
MUESTRA
Es una parte de la población que se espera sea representativa de ella. Con frecuencia
usaremos el término muestra para referirnos a los datos muéstrales 𝑋1 , 𝑋2 , …, 𝑋𝑛
VARIABLES:
Variables discretas: Son aquellas cuyos valores posibles tienen interrupción (esto es,
se separan sin haber valores intermedios) Por lo general provienen de un proceso de
conteo.
DATOS ESTADISTICOS.
Los valores posibles de una característica X los denotaremos por x, mientras que los
valores realmente observados de esa característica X, los llamaremos datos y los
denotaremos por 𝑋𝑖 donde el valor del subíndice nos indica que es la i-ésima
observación de X.
Con frecuencia usaremos el término población para referirnos a la totalidad de datos que
podrían recopilarse en una situación dada.
Estadística:
Característica numérica de una muestra.
1.2 Antecedentes
Las primeras noticias que se tienen de la Estadística datan del año 2 238 a. de J.C. en
que Yao, Emperador de la China, mandó a hacer un censo general en aquel imperio. En
Egipto, y entre los judíos, en los tiempos más remotos, también se formaron inscripciones
regulares de habitantes y más tarde, Roma desarrolló notablemente la institución del
censo; en todos estos pueblos, el objeto primordial de estos registros era aumentar los
tributos y conocer el número de combatientes o efectivos de que disponían para los
combates.
En el siglo XV, todos los pueblos de Europa sintieron la necesidad de conocer la situación
del propio país y la de los demás y entonces empezaron a publicarse las que pueden
llamarse propiamente obras de Estadística.
“El nombre de Estadística alude al enorme interés de esta rama de la matemática para
los asuntos del Estado”
En los primero decenios del siglo XIX, otros dos matemáticos, Laplace y Gauss, realizaron
importantes trabajos sobre el cálculo de probabilidades aplicadas a la astronomía. Quetelet,
estadístico belga muy famoso aplicó dicha ciencia a los problemas sociales y educativos
pero Francis Galton le superó ejerciendo una mayor influencia con la aplicación de la
Estadística a las Ciencias Sociales y en los estudios de la Herencia, Sociología y muchas
otras ciencias
Características de la estadística.
Teoría de la Probabilidad.
Estimar los parámetros del modelo supuesto a partir de las observaciones muestrales
utilizando los métodos de Inferencia Estadística: estimación puntual, estimación por
intervalos de confianza y contrastes de hipótesis paramétricos.
Marco de Muestreo
Es una lista de elementos pertenecientes a la población de donde extrae la muestra.
El marco de muestro debe ser idéntico a la población. De manera ideal el marco debe enlistar cada
elemento de la población sólo una vez. Sin embargo, no siempre es posible porque resulta
impráctico o imposible seleccionar la población total en forma directa. Es importante que el
marco de muestreo sea representativo de la población, ya que sólo los elementos del marco
tienen oportunidad de ser seleccionados como parte de la muestra.
Una vez establecido un marco de muestreo representativo, es posible proceder a seleccionar los
elementos muestrales a partir de dicho marco. Este proceso de selección es definido por el diseño
de la muestra.
Hay muchos tipos de diseño de la muestra. Sin embargo, todos ellos producen muestras que se
clasifican en dos categorías: no probabilísticas y probabilísticas.
Muestras No Probabilísticas
Son las que se seleccionan a partir de su consideración como “Típicas”.
Una persona obtiene una muestra no probabilística cuando elige elementos que, en su opinión, son
representativos de la población. La validez de los resultados obtenidos con una muestra no
probabilística refleja la solidez de quien la selecciona.
Muestras Probabilísticas
Son las muestras donde los elementos por seleccionar se toman de acuerdo con leyes
probabilísticas. Cada elemento en una población tiene cierta probabilidad de ser
seleccionado como parte de la muestra.
A continuación se verán algunos de los diseños de muestras más simples y sencillos de emplear.
El muestreo aleatorio simple es uno de los métodos utilizados con mayor frecuencia para
seleccionar muestra probabilísticas.
Debe realizarse el esfuerzo necesario para asegurar que cada elemento tenga igual probabilidad de
ser seleccionado cuando se extrae una muestra aleatoria simple. A menudo se cometen errores
porque el término aleatorio (con probabilidad igual) se confunde con fortuito (sin un patrón
definido). El empleo de un generador de números aleatorios o de una tabla de números aleatorios
es el procedimiento idóneo para seleccionar una muestra aleatoria simple. Se elige, para integrar
la muestra cada elemento numerado en el marco de muestreo que corresponda a un número
aleatorio seleccionado.
Muestras Sistemática
Es aquella donde se selecciona todo k – ésimo elemento en el marco de muestreo después
de una inicio aleatorio entre los primeros k elementos.
Este método de selección utiliza la tabla de números aleatorios sólo una vez, para encontrar el
punto inicial (el primer elemento que se observa).
Muestras Estratificada
Es aquella que se obtiene estratificando primero el marco de muestreo y seleccionando
después un número fijo de elementos de cada estrato mediante un muestreo aleatorio
simple.
Otro método de muestreo en el que se hace una estratificación de la población es el muestreo por
conglomerados.
Muestra Por Conglomerado
Es aquella que se obtiene estratificando primero el marco de muestreo y seleccionando
después todos los elementos de algunos estratos (no todos los estratos.)
La muestra por conglomerado se obtiene utilizando números aleatorios, o un procedimiento
sistemático para identificar primeramente los estratos (conglomerados) que serán muestrados, y
empleando después todos los elementos que se encuentran en dichos estratos.
Ejercicios Propuestos.
d. La distancia a la que puede llegar un balón de fútbol al ser pateado por las
jóvenes de primer año de inglés.
5. Señale con una A las series constituidas por datos cualitativos (o atributos) y con
una V los datos cuantitativos.
Considere una población sencilla que se compone únicamente de los enteros 1, 2 y 3 (con un
número ilimitado de cada uno). Pueden seleccionarse nueve muestras distintas de tamaño 2
(dos dígitos) de esta población: (1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3).
Si la población consta de los números 1, 2, 3 y 4, enliste todas las muestras posibles de tamaño
2 que podrían seleccionarse.
Conceptual:
1. Estudiar con mucho esmero la importancia de la Estadística y la Educación, ya que ambas son de vital importancia en el
ejercicio previo a la Enseñanza
Procedimental:
2. Interpretar de manera directa las similitudes y diferencias de Estadísticas y Educación, partiendo de de la información actual
Actitudinal:
3. Asumir con madurez la importancia que tiene el orden de la Educación y su realización a la hora de aplicarlo.
Contenido Temático:
1. Estadísticas actuales de la Educación:
1.1 Conceptos
1.2 Características
1.3 Importancia de la estadística en función de la educación
1.4 Ejercicios estadísticos de la Educación
1.5 Manejo actual de estadísticas en Educación
1.6 Hojas actuales utilizadas en estadísticas educacionales
1.1 Conceptos
La estadística resulta fundamental, por lo que ha adquirido un papel clave en la
investigación. Se usa como un valioso auxiliar y en los diferentes campos del
conocimiento y en las variadas ciencias. Es un lenguaje que permite comunicar
información basada en datos cuantitativos.
La Estadística es la ciencia cuyo objetivo es reunir información cuantitativa concerniente
a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos
datos unos significados precisos o unas previsiones para el futuro
Pero además… Deben manejar otras estadísticas, como las que se refieran a La salud
de los estudiantes, Cuáles son las enfermedades más frecuentes que padecen,
Estadísticas sociales, como lugar donde viven, con quien viven Estadísticas
demográficas referidas a la población de la comunidad y su estructura por sexo y edad,
número de hermanos/as, niños/as en edad escolar Los CENSOS Estadísticas que
periódicamente se originan en los ministerios de educación, constituyen “registros
continuos”. Cantidad de alumnos en primaria, secundaria y nivel terciario o universitario
Indican nivel de conocimiento. Identifican cantidad de alumnos que asisten a
establecimientos privados o públicos. Identifican qué asignaturas presentan más
dificultades para los niños y jóvenes Utilizar los recursos estadísticos que son una
manifestación del resultado de desarrollo educativo se podría obtener mejores productos
en el proceso de enseñanza-aprendizaje.
Para poder analizar datos, ya sea de forma manual o por computadora, hay que entender
que trataremos a partir del estudio de la realidad observable crear un modelo numérico
teórico donde se estudian variables para describirlas y analizar sus relaciones. Para
hacer esto primero es necesario definir algunos términos teóricos.
Variables Cuantitativas, son las que sus características están expresadas en valores
numéricos, éstas asumen cualquier valor y pueden variar en cualquier cantidad, sobre
una escala aritmética e infinita y pueden subdividirse en dos tipos “continuas o
medibles” y “discretas o contables”.
Las variables generan “datos”, con ellos se hace la estadística y cada uno de éstos ocupa
una celda de una matriz o base de datos. La Matriz de datos es un ordenamiento de
datos en fila y columnas donde cada fila es un individuo, una parcela, una muestra, una
unidad experimental o una encuesta determinada y cada columna: una variable. Los
programas Access, Excel, Infostat y SPSS ordenan los datos en forma de matriz. Por
ejemplo en una encuesta (cuestionario) cada pregunta que se tiene, genera al menos,
una variable generalmente discreta. Hay casos donde una pregunta puede generar
muchas variables de tipo dicotómico, SI- NO, que se suele codificar como 1= SI y 0=
NO.
• Peso de un estudiante.
• Diámetro de una casa.
• Color de ojos.
• Tipo de techo.
• Vida útil de un monitor
• # de ladrillos de una pared.
• Belleza de una flor.
• Temperatura semanal.
• Largo de peces de un estanque.
• Diámetro de un tornillo
Análisis de datos, TDF y Gráficos
Una vez que los datos se han codificado, transferidos a una matriz y guardado en una
computadora podemos proceder a analizarlos, proceso que se hace con un programa
estadístico como SPSS o INFOSTAT, de forma manual solo se pueden manejar pocos
datos y variables es por ello que el énfasis de este libro está más en la interpretación
de resultados que en los procedimientos de cálculo.
Una primera tarea luego de construir una tabla o matriz de datos, es explorarlos
buscando información atípica o anormal y corregir los casos que la información atípica
se deba a una mala digitación o error en la recolección de datos.
Lo siguiente para observar el comportamiento de los datos es realizar una “distribución
frecuencias” en forma de tabla y gráficos. Para esto, los datos se agrupan en clases o
categorías y para grupo se calcula las frecuencias absolutas y relativas.
• Las Escala de Razón Constante, tienen todas las propiedades de las Escalas de
intervalos más un cero absoluto, por ejemplo las medidas de tiempo, peso y
distancia, el valor “0” representa ausencia del valor.
• Un caso especial de escala ordinal es la escala de Likert, esta escala es muy usada en las ciencias
sociales y se usa para medir actitudes, “Una actitud es una predisposición aprendida
par responder consistentemente de una manera favorable o desfavorable ante un
objeto de sus símbolos”. Así las personas tenemos actitudes hacia muy diversos
objetos o símbolos, por ejemplo: actitudes hacia la política económica, un profesor,
la ley, nosotros, etc. Las actitudes están relacionadas con el comportamiento que
mantenemos. Estas mediciones de actitudes deben interpretarse como “síntomas” y
no como hechos. Esta escala es bipolar porque mide tanto el grado positivo como
negativo de cada enunciado y consiste en un conjunto de ítem presentado en forma
de afirmaciones o juicios ante los cuales se pide reacción a los sujetos en estudio
en una escala de 5 puntos, cada punto tiene un valor numérico. Un ejemplo de cómo
calificar con afirmaciones positivas es ¿Le gusta cómo se imparte la clase de
estadística?: 1- Muy en desacuerdo, 2- En desacuerdo, 3- Ni de acuerdo, ni en
desacuerdo, 4- De acuerdo, 5-Muy de acuerdo.
• Estar de acuerdo con la idea presentada significa un puntaje mayor.
Para crear una base de datos hay que recordar que se está obteniendo una matriz de
datos donde en la primera fila se tiene el nombre abreviado de la variable y en el resto
de las filas los datos para cada encuesta o individuo en estudio. Las variables
cualitativas se deben recodificar, veamos el siguiente ejemplo hipotético de 8 encuestas:
Esta matriz se codifica así: la variable “Sexo”: 1= varón, 2 = mujer. Para la variable
“comunidad” hay 4 tipos diferentes donde: 1= San Carlos, 2= San Miguelito, 3= El
Castillo y 4= Morrito y para “Labor realizado”: 1= en otra finca, 2= en la cuidad y 3= en
la propia finca.
Hoja de Encuesta
Número de ficha___________
Fecha: ______________________________________________________
Primer Apellido_______________________________________________
Segundo Apellido______________________________________________
Nombres:_____________________________________________________
Año____________
Dirección: _____________________________________________________
Estado Civil: ____________
Número de personas que habitan la vivienda__________________________
Nivel de estudio de ellos__________________________________________
Edad de cada una de ellos_________________________________________
Profesión: _____________________________________________________
Ejercicio 1.5:
Defina variables para caracterizar a los estudiantes del curso con el objetivo de
determinar posibles causas que tengan influencia en el rendimiento académico del grupo.
Códigos: Estado Civil: 1 Soltero, 2 Casado; Origen: 1 San Carlos, 2 No dé San Carlos ;
Sexo: 1 Varón, 2 Mujer; Becas: 1 Si 2 No; Opinión: 1 Negativa 5 Positiva
Distribución de frecuencia para datos libres.
La frecuencia absoluta f es el número de veces que ocurre el valor de x en la
muestra. Esta es una distribución de frecuencias no agrupada. “
Ejemplo 1.
Distribución de frecuencias del número de días de atraso en el pago de 10
cuentas de crédito.
Fa Frecuencia relativa
𝒇𝒂
𝒇𝒓 = 𝒏
X fr %fi
No de días No dé cuenta
0 2 0.2 20
1 3 0.3 30
2 4 0.4 40
3 1 0.1 10
10 1 100
Fuente: BANPRO.
R= H-L.
El número de clases es: M= 1+3.3log(n) ó R= √𝑛
𝑅
La amplitud de clase es el cociente entre el rango y la marca de clase: A=
𝑀
Ls ultima clase= Li primera clase + MC
𝑓𝑖
𝑓𝑟 = Ecuación para calcular la frecuencia relativa de clases.
𝑛
El límite inferior de clase es el valor más pequeño que puede asignarse en
cada clase. Límites superiores de clase son los valores de mayor magnitud
que pueden asignarse a cada clase. En el presente ejemplo las clases son:
Lri de una clase es 0.5 unidad menos que el Li de clase y el Lrs es 0.5 unidad
más que el Ls de clase. Si lo límites de clase es un numero con un digito decimal
se resta y se le suma Li y Ls 0.05 al Lri y Lrs y asi sucesivamente.
Frecuencia absoluta: número de veces que se repite un mismo valor.
Frecuencia porcentual de clase: es la frecuencia de una clase, expresada como
porcentaje y la denotamos f %.
Frecuencia absoluta acumulada: suma de todas las frecuencias absolutas de
valores menores o iguales al considerado: Se denota 𝑓𝑎
Frecuencia porcentual acumulada: Suma de los porcentajes de frecuencia
acumulada se denota 𝑓𝑎%
EJEMPLO 1.1
Los siguientes datos corresponden a consumos mensuales registrados (en
cienes de córdobas) en 30 familias del barrio Costa Rica.
24 16 26 31 17 25 17 23 23 19 21 17 13
20 30 24 19 22 21 18 25 14 29 20 26 15
27 21 22 23
13 14 15 16 17 17 17 18 19 19 20 20 21 21
21 22 22 23 23 23 24 24 25 25 26 26 27 29
30 31
𝑓𝑖 3
fr= 𝑛 → fr=30 →fr= 0.1
𝑓𝑖𝑥100 3𝑥100
%𝑓𝑟 = →%𝑓𝑟 = →%𝑓𝑟 = 10
𝑛 30
Ejercicio Propuesto.
1) Para cada grupo de datos construya una tabla de distribución de frecuencia para
datos agrupados:
8 23 18 22 22 15 21 23 25 18 24
22 21 37 19 22 22 12 27 16 26 32
20 20 30 25 20 25 30 15 10 40
35 25 15 25 25 40 25 30 5 25
25 30 15 20 45 25 35 25 10 10
15 20 20 20 20 25 20 20 15 20
5 20 20 10 5 20 30 10 25 15
0.7 1.0 0.6 0.4 0.7 0.7 1.2 0.8 1.2 0.4 0.5 0.4
21 19 22 19 18 20 23 19 19 20
19 20 21 22 21 20 22 20 21 20
21 19 21 21 19 19 20 19 19 19
20 20 19 21 21 22 19 19 21 19
21 19 18 22 21 24 20 24 17 18
GRAFICA DE BARRAS:
Este gráfico está constituido por un conjunto de barras o rectángulos, separados
por distancias iguales, cuyas alturas son el valor de los datos correspondientes
al atributo que señalan sus bases.
𝑓𝑖𝑥360
Angulo de sector= 𝑛
Ojiva:
Ubicamos en el eje horizontal los límites superiores de todas las clases. Algunos
prolongan el polígono hasta el límite superior imaginario de la clase imaginaria
inferior inmediata.
Ejercicios propuestos.
1. Un cobrador de una empresa ha registrado el número de días que tarda en cobrar cada una
de sus cuentas de créditos. Se han obtenido los siguientes 30 registros:
b) ¿Qué le dice a usted esta descripción gráfica acerca del tiempo de búsqueda que invierten
los compradores de vivienda?
3. Los siguientes datos representan las declaraciones mensuales de impuestos sobre ventas (en
miles de córdobas) que los 30 establecimientos comerciales de la ciudad A presentaron ante el
correspondiente contralor.