Taller 3
Taller 3
Taller 3
ASIGNATURA:
Procesos Estocásticos
DOCENTE:
Prof. Arturo Peralta. PhD.
INTEGRANTES:
Néstor Barahona
Andrés Criollo
Israel Lituma
Camila Minchala
Freddy Piña
Paul Villa.
TEMA:
Resolución del taller 3
FECHA:
16/11/2020
TALLER 3 – VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD
1. En una lotería se venden 1000000 de boletos de $10 cada uno. Hay un primer premio de
$3000000, 10 premios de $200000, 100 premios de $2000, 1000 premios de $100 y 10000
boletos reciben un reembolso del costo del boleto. Halle el valor esperado de la ganancia
neta por boleto.
- Se consideran variables discretas por tener un solo valor asignado, sin poder ser cambiado.
Por lo tanto se utilizará la Esperanza Matemática en este ejercicio.
Datos:
- Probabilidad 1:
1
𝑃(𝑥 = 3000000) = = 10−6
1000000
- Probabilidad 2:
10
𝑃(𝑥 = 200000) = = 10−5
1000000
- Probabilidad 3:
100
𝑃(𝑥 = 2000) = = 10−4
1000000
- Probabilidad 4:
100
𝑃(𝑥 = 100) = = 10−3
1000000
- Probabilidad 5:
10000
𝑃(𝑥 = 10) = = 10−2
1000000
Total de boletos ganadores:
𝑇𝑏𝑔 = 1 + 10 + 100 + 100 + 1000 + 10000 = 11111
Por lo tanto, para obtener el número de boletos perdedores:
𝑇𝑏𝑝 = 1000000 − 11111 = 988889
Entonces:
988889
𝑃(𝑥 = −10) = = 0.99
1000000
2. Se plantea la tabla de probabilidades y variables:
De ahí la fórmula:
𝐸(𝑥) = ∑ 𝑥 𝑓(𝑥)
𝑥
𝐸(𝑥)𝑔 = 3 ∗ 106 ∗ 10−6 + 2 ∗ 105 ∗ 10−5 + 2 ∗ 10−3 ∗ 10−4 + 1 ∗ 102 ∗ 10−3 + 10 ∗ 10−2
= 5.4 𝑇𝑜𝑡𝑎𝑙 𝑔𝑎𝑛𝑎𝑑𝑜 𝑝𝑜𝑟 𝑗𝑢𝑔𝑎𝑑𝑜𝑟.
Ahora:
𝑬(𝒙)𝒑 = 𝟓. 𝟒 − 𝟏𝟎 ∗ 𝟎. 𝟗𝟗 = 𝟒. 𝟓 𝑻𝒐𝒕𝒂𝒍 𝒑𝒆𝒓𝒅𝒊𝒅𝒐 𝒑𝒐𝒓 𝒋𝒖𝒈𝒂𝒅𝒐𝒓.
Finalmente:
𝐸(𝑥)𝑛𝑒𝑡𝑜 = 10 − 4.5 = 5.5 𝐺𝑎𝑛𝑎𝑛𝑐𝑖𝑎 𝑛𝑒𝑡𝑎 𝑝𝑜𝑟 𝑏𝑜𝑙𝑒𝑡𝑜
2. Una máquina fabrica CHIPS y se ha comprobado que el 2% de los mismos son defectuosos. Si se
vende en paquetes de 29, se pide: ¿Cuál es la probabilidad de que al comprar un paquete haya en
el mismo 2 defectuosos?
4. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribución
exponencial con media de 16 años. ¿Cuál es la probabilidad de que a una persona a la que se le ha
implantado este marcapasos se le deba reimplantar otro antes de 20 años?
𝑋 = 𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑚𝑎𝑟𝑐𝑎𝑝𝑎𝑠𝑜
𝑥 𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑒𝑛 𝑓𝑜𝑟𝑚𝑎 𝑒𝑥𝑝𝑜𝑛𝑒𝑛𝑐𝑖𝑎𝑙
𝑃( 𝑥 < 20)
El método para aplicar es la distribución acumulada teniendo en cuenta la función de densidad de
probabilidad de la distribución exponencial:
1 −𝑥
𝐹(𝑥 ) = {𝐵 𝑥𝑒 𝑠𝑖 𝑥 > 0
𝐵
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Cuando B=16
La relación entre función de densidad de probabilidad y función de distribución acumulada es
∞
𝐹 (𝑥 ) = 𝑃(𝑋 ≤ 𝑥 ) = ∫ 𝐹 (𝑦)𝑑𝑦
−∞
20
1 −𝑥
𝐹 (20) = 𝑃(𝑋 ≤ 20) = ∫ 𝑒 16 𝑑𝑥
0 16
5. El tiempo durante en cual cierta marca de batería trabaja en forma efectiva hasta que falle
(tiempo de falla) se distribuye según el modelo exponencial con un tiempo promedio de fallas igual
a 360 días. a) ¿Qué probabilidad existe que el tiempo de falla sea mayor que 400 días? b) Si una de
estas baterías ha trabajado ya 400 días, ¿qué probabilidad hay de que trabaje más de 200 días más?
c) Si se están usando 5 de tales baterías, calcular la probabilidad de que más de dos de ellas
continúen trabajando después de 360 días.
𝜷𝒆−𝜷𝒙 , 𝒔𝒊 𝒙 ≥ 𝟎
𝒇 ( 𝒙) {
𝟎 , 𝒔𝒊 𝒙 < 𝟎
- Entonces:
1 − 𝑥
𝑓(𝑥) = 𝑒 360 , 0 ≤ 𝑥 ≤ ∞
360
a. Si x˃400 en base a: 𝑃(𝑥 > 𝑠) = 𝑒 −𝛽𝑡
400
𝑃(𝑥 > 400) = 𝑒 −360 = 0.33
b. Si x>400+200 en base a: 𝑃(𝑥 > 𝑠 + 𝑡/𝑥 > 𝑠)
200
𝑃(𝑥 > 400 + 200/𝑥 > 400) = 𝑃(𝑥 > 200) = 𝑒 −360 = 0.57
c. Si x>360
360
𝑃(𝑥 > 360) = 𝑒 −360 = 0.37
Ahora: Siendo y= # de baterías/5 que siguen trabajando después de 360 días.
Entonces:
2
6. Supongamos que en un enlace se tiene una probabilidad de error de bit igual a 𝟏𝒆−𝟔 .
Datos:
𝐸𝑟𝑟𝑜𝑟 = 1𝑒 −6 = 0.0025 1 𝑏𝑖𝑡 = 6,125 𝑏𝑦𝑡𝑒𝑠
𝐸 = 2.5𝑥10−3 𝑝𝑜𝑟 𝑐𝑎𝑑𝑎 𝑏𝑖𝑡 1𝐾𝐵 = 1000 𝑏𝑦𝑡𝑒𝑠
a) ¿Cuántos bits deben transmitirse en promedio para recibir un bit malo?
𝑁 = 0.125/(2.5𝑥10−3 )
𝑁 = 50 𝑠𝑒 𝑑𝑒𝑏𝑒 𝑡𝑟𝑎𝑛𝑚𝑖𝑡𝑖𝑟 50 𝑏𝑖𝑡𝑠 𝑝𝑎𝑟𝑎 𝑟𝑒𝑐𝑖𝑏𝑖𝑟 𝑢𝑛 𝑏𝑖𝑡 𝑚𝑎𝑙𝑜
Verificación:
1 𝑏𝑖𝑡 𝑚𝑎𝑙𝑜 = (𝐸𝑟𝑟𝑜𝑟) ∗ 𝑁
1 = (2.5𝑥10−3 ) ∗ 50
1 𝑏𝑖𝑡 𝑚𝑎𝑙𝑜 = 0,125 𝑏𝑦𝑡𝑒
1 𝑏𝑖𝑡 = 0,125 𝑏𝑦𝑡𝑒
𝑁 = 1 𝑏𝑖𝑡/𝑒𝑟𝑟𝑜𝑟
(1096,63)(0,0025)
𝑃1 =
8000
𝑃1 = 0,034
c) ¿Ocurrirá un error?
𝑃2 = 1 − 𝑃1
𝑃2 = 1 − 0,034
𝑃2 = 0,966
𝑃2 + 𝑃1 = 1
0,966 + 0,034 = 1
1=1
7. Supongamos que una fábrica produce chips con un tiempo medio entre fallas (mean time
between failures – MTBF) de 4500 horas. Es decir, se espera que los chips no fallen sino hasta 4500
horas después de haber sido fabricados. Al tomar datos estadísticos de 100 chips fabricados se
encuentra que los chips han fallado luego de los tiempos especificados en la siguiente tabla:
Grafique e indique que tipo de pdf cumple determine sus parámetros fundamentales.
DISTRIBUCION DE POISSON:
Cuando la variable aleatoria es discreta, esto ya indica que se está́ en presencia de una distribución
de Poisson. Por ejemplo, se pueden encontrar variables como "número de camiones que tiene
accidente" o "números de llamadas a una central".
Figure 1 Grafica de Excel distribución de Poisson
PARÁMETROS:
Calculamos la media.
3600 + 3900 + 4200 + 4500 + 4800 + 5100 + 5400
𝑥̅ = = 4500
7
𝐸 (𝑋) = 𝜇 = 4500
𝑉𝑎𝑟(𝑋) = 4500
𝜎 = √4500 = 67,08
𝑘 = 𝑒𝑠 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑛𝑢𝑚𝑒𝑟𝑜 𝑞𝑢𝑒 𝑚𝑒 𝑝𝑟𝑒𝑔𝑢𝑛𝑡𝑒𝑛 (1,2,3 … 𝑛)
a) Implemente la función de una variable gaussiana, generando valores para el eje x, y eligiendo
valores adecuados para la media y la varianza. Grafique.
%Grupo 3
%Ejercicio 8
clc;
%Literal (a)
x = -2:0.1:18;
y = gaussmf (x, [3 8]);
figure
plot (x, y)
Media=mean(y)
Varianza=var(y)
Resultado:
Media =
0.3738
Varianza =
0.1254
Gráfica:
b) Usando la función randn() genere una cantidad adecuada de datos aleatorios enteros de hasta
cuatro cifras con distribución normal, cuya media sea distinta de cero. Grafique la secuencia de
datos, su pdf, su CDF y encuentre valores estadísticos como la media, la mediana y la moda;
Encuentre además la desviación estándar y la varianza. Presente un reporte con conclusiones
relevantes.
%Literal b)
r=randi ([-3500 3500],3500)
figure
plot(r)
Media=mean(r)
Mediana=median(r)
Moda=mode(r)
DesviacionStandar=std(r)
Varianza=var(r)
Resulted
r=
Columns 1 through 4
Media = -62.4929
Mediana = -40.5000
Moda = 752
Desviación Estándar = 2.0216e+03
Varianza = 4.0869e+06
Gráfica:
9. Dada una variable aleatoria gaussiana, 𝜉, con media 𝜇 = 0.5 y varianza 𝜎2 = 0.0625, grafique la pdf
y CDF (emplee un software a su elección para el efecto), se sugiere que para la gráfica de la CDF
emplee la función erfc con el cambio de variable correspondiente. Además, evalúe las siguientes
probabilidades: 𝑃(𝜉 ≤ 0.125), 𝑃(0.2 ≤ 𝜉 ≤ 0.625), 𝑃(𝜉 ≥ 0.45).
Código Matlab:
%% Ejercicio 9
clear all
clc
Media=0.5;
Var=0.0625;
R=sqrt(Var);
pd=makedist('Normal','mu',Media,'sigma',R) %Crea una distribucion normal
x=(-(2.5*R):0.01:(2.5*R))+Media;
y=pdf(pd,x);
plot(x,y)
title('DISTRIBUCION NORMAL PDF');
grid on
figure
y=cdf(pd,x); %Distribucion Normal estandar con la media CDF
plot(x,y)
title('DISTRIBUCION NORMAL CDF');
grid on
%% Evaluando las siguientes Probabilidades
%Distribución normal estándar CDF con media y desviación estandar
%Probabilidad = normcdf(x,Media,R)
disp('Probabilidad de que sea menor 0.125 : ');
P1=normcdf(0.125,0.5,R);
disp(P1)
disp('Probabilidad de que este entre 0.2 y 0.625 : ');
P2=normcdf(0.625,0.5,R)-normcdf(0.2,0.5,R);
disp(P2)
disp('Probabilidad que sea mayor 0.45 : ');
P3=1-normcdf(0.45,0.5,0.25);
disp(P3)
Resultados:
Fig1. Graficas de Distribuciones normal PDF Y CDF
Fig3. Resultados de Probabilidades
10. El 20% de todos los teléfonos de cierto tipo son llevados a servicio mientras se encuentran
dentro de la garantía. De éstos, 60% puede ser reparado, mientras el 40% restante debe ser
remplazado con unidades nuevas. Si una compañía adquiere diez de estos teléfonos, ¿cuál es la
probabilidad de que exactamente dos sean remplazados bajo garantía?
Datos:
p Remplazados 40% = 0.4
q reparados 60% = 0.6
Son 10 teléfonos.
n=10
k=2
p=0.4
q=0.6
Distribución binomial:
𝒏!
𝑷(𝒌) = ∗ 𝑷𝒌 ∗ 𝒒𝒏−𝒌
𝒌! ∗ (𝒏 − 𝒌)!
Entonces:
10!
= ∗ (0.4)2 ∗ (0.6)8
2! (10 − 2)!
𝑷(𝒌) = 𝟎. 𝟏𝟐𝟎𝟗𝟑
11. Utilizando una hoja de cálculo (por ejemplo, MS Excel) determine los datos y grafique la PDF y
CDF de una distribución binomial, correspondiente a la probabilidad recibir bits errados (0–10),
cuando se transmite una trama de 120000 bits en un canal con BER=10–5, como se ejemplifica a
continuación (si usa MS Excel utilice la función DISTR.BIN()).
Distribución de probabilidad
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1 2 3 4 5 6 7 8 9 10
PDF CDF
12. Investigar sobre autocorrelación y correlación cruzada, crear un programa en Matlab, que pueda
mediante estos conceptos detectar el reconocimiento de patrones, e imágenes, además, investigar
y presentar alguna técnica diferente para el reconocimiento de patrones de imágenes.
Código en Matlab:
clear all
clc
%Leer imagenes
Imagen= imread('Imagen.jpg');
figure
imshow(Imagen)
Subimagen= imread('Subimagen2.jpg');
figure
imshow(Subimagen)
%Convertir las dos imagenes a escala de grises
ImagenG=rgb2gray(Imagen);
figure
imshow(ImagenG)
SubimagenG=rgb2gray(Subimagen);
figure
imshow(SubimagenG)
%Descomposiciòn de la imagen en metadatos
ImR=double(Imagen(:,:,1));
ImG=double(Imagen(:,:,2));
ImB=double(Imagen(:,:,3));
figure
imshow(ImR)
figure
imshow(ImG)
figure
imshow(ImB)
%Correlación cruzada y visualizacion del resulatado como una superficie
C= normxcorr2(SubimagenG,ImagenG);
figure
surf(C),shading flat
%Encontrar el pico de la correlación cruzada
[ypeak, xpeak] = find(C==max(C(:)));
yoffSet = ypeak-size(SubimagenG,1);
xoffSet = xpeak-size(SubimagenG,2);
%Vista del area emparejada
figure
imshow(ImagenG); imrect(gca, [xoffSet+1, yoffSet+1, size(SubimagenG,2), size(SubimagenG,1)]);
%Ver si la imagen emparejada fue extraida de la imagen principal
xbegin=round(xoffSet+1);
xend=round(xoffSet+size(Subimagen,2));
ybegin=round(yoffSet+1);
yend=round(yoffSet+size(Subimagen,1));
%Superponer la imagen utilizando el desfase que se determino en el paso anterior
Figura=uint8(zeros(size(Imagen)));
Figura(ybegin:yend,xbegin:xend,:)=Subimagen;
figure
imshow(Figura)
figure
imshowpair(Imagen,Figura,'blend')
Descripción de la simulación:
AUTOCORRELACIÓN
Definición:
Dependiendo del campo de estudio se pueden definir diferentes tipos de autocorrelación sin que
estas definiciones sean equivalentes. En algunos campos se utilizan indistintamente las funciones
de autocorrelación y de auto covarianzas, dado que ambas sólo difieren entre sí en una constante
de proporcionalidad que es la varianza (en este caso, la auto covarianza de orden k>0).
La autocorrelación o dependencia secuencial es una herramienta estadística utilizada
frecuentemente en el procesado de señales.
La función de autocorrelación se define como la correlación cruzada de la señal consigo misma. La
función de autocorrelación resulta de gran utilidad para encontrar patrones repetitivos dentro de
una señal, como la periodicidad de una señal enmascarada bajo el ruido o para identificar
la frecuencia fundamental de una señal que no contiene dicha componente, pero aparecen
numerosas frecuencias armónicas de esta.
Aplicaciones de la autocorrelación:
Propiedades:
Definiremos las propiedades de la autocorrelación unidimensional. La mayoría de sus propiedades
son extensibles fácilmente a los casos multidimensionales.
La consecuencia es que la señal puede expresarse indistintamente en el dominio del tiempo (t) o
el dominio de las frecuencias (f), al existir esta correspondencia entre ambos, y entendiendo que
la señal está completamente determinada a partir del total de sus momentos o del total de sus
frecuencias.
CAUSAS DE LA AUTOCORRELACIÓN:
La autocorrelación es un fenómeno que se presenta en muestras que contengan de datos
asociados al tiempo, aunque también puede presentarse cuando se trabaja con datos de corte
transversal, en cuyo caso hablamos de “autocorrelación espacial”.
Otras causas posibles de la existencia de autocorrelación en algunas situaciones específicas, como,
por ejemplo:
a) Por la existencia de ciclos y tendencias en los datos: Si la variable a explicada presenta un
comportamiento cíclico que no viene explicado por las variables explicativas, entonces
dicho comportamiento cíclico estará recogido en el término de error del modelo.
b) Cuando se comete un error de especificación inicial del modelo por omisión de variables
relevantes. La omisión de variables relevantes, en principio, no debería suponer
autocorrelación en el término de error salvo que dichas variables omitidas estén
correlacionadas entre sí.
c) Cuando se comete un error de especificación en la forma funcional del modelo. Una mala
especificación de la forma funcional del modelo puede provocar” rachas” de residuos
positivos seguidas de otras de residuos negativos y así sucesivamente.
CONSECUENCIAS:
1) Continúa siendo la solución única del sistema de ecuaciones normales (SEN) que se
obtienen al aplicar el método de estimación por mínimos cuadrados ordinarios (MCO).
2) Continúa siendo un estimador lineal e insesgado de los coeficientes del modelo. Estas
propiedades del método de estimación MCO en contexto del MODELO BÁSICO DE
REGRESIÓN LINEAL (MBRL) no dependen de las hipótesis sobre las perturbaciones, por lo
que también se mantienen en el caso más general del MODELO DE REGRESIÓN LINEAL
GENERALIZADO (MRLG), donde la matriz de varianzas -covarianzas del término de error no
es escalar.
Un resultado negativo en 𝐶12 indica una correlación negativa, es decir un incremento en una
variable se asocia con un decremento en la otra.
La anterior definición de la correlación cruzada produce un resultado que depende del número de
muestras. Una definición alternativa es:
𝑁−1
1
𝐶12 = ∗ ∑ 𝑥1 [𝑛] ∗ 𝑥2 [𝑛]
𝑁
𝑛=0
Solución:
9−1
1
𝐶12 = ∗ ∑ 𝑥1 [𝑛] ∗ 𝑥2 [𝑛]
9
𝑛=0
8
1
𝐶12 = ∗ ∑ 𝑥1 [𝑛] ∗ 𝑥2 [𝑛]
9
𝑛=0
1
𝐶12 = [4 (4) + 2(1) + (−1)(3) + 3(7) + (−2)(4) + (−6)(−2) + (−5)(−8) + 4(−2)
9
+ 5(1)]
𝐶12 = 5
1
Sin embargo, la definición 𝐶12 = 𝑁 ∗ ∑𝑁−1
𝑛=0 𝑥1 [𝑛] ∗ 𝑥2 [𝑛] debe ser modificada porque en muchos
casos puede indicar correlación cruzada cero y sin embargo las dos señales estar totalmente
correlacionadas, tal es el caso de dos señales en oposición de fase, como se muestra en la figura.
Para resolver este problema es necesario rotar o retrasar una de las señales respecto de la otra.
Tal y como se representa en la Figura, la señal x2 [n] se retrasa o rota a la izquierda k intervalos de
muestreo. Otra alternativa equivalente es rotar x1 [n] a la derecha. En este caso, la nueva
expresión para la correlación cruzada es:
𝑁−1
1
𝐶12 [𝑘] = ∗ ∑ 𝑥1 [𝑛] ∗ 𝑥2 [𝑛 + 𝑘]
𝑁
𝑛=0
𝑁−1
1
𝐶21 [𝑘] = ∗ ∑ 𝑥1 [𝑛] ∗ 𝑥2 [𝑛 − 𝑘]
𝑁
𝑛=0
Correlación cruzada de procesos estocásticos:
En análisis de series de tiempo y estadísticas, la correlación cruzada de un par de procesos
aleatorios es la correlación entre los valores de los procesos en diferentes momentos, en función
de los dos tiempos. Sea un par de procesos aleatorios y cualquier punto en el tiempo (puede ser
un número entero para un proceso de tiempo discreto o un número real para un proceso de
tiempo continuo). Entonces es el valor (o realización) producido por una ejecución determinada
del proceso en el momento.
donde es el operador de valor esperado. Tenga en cuenta que esta expresión puede no estar
definida.
Función de covarianza cruzada:
Restar la media antes de la multiplicación produce la covarianza cruzada entre tiempos y: 𝑡1 𝑡2
Tenga en cuenta que esta expresión no está bien definida para series o procesos de todos los
tiempos, porque es posible que la media no exista o que la varianza no exista.
Tres ejemplos de vecindarios utilizados para definir una textura y calcular un patrón
binario local (LBP).
Una extensión útil del operador original es el denominado patrón uniforme, que se puede
utilizar para reducir la longitud del vector de características e implementar un descriptor
invariante de rotación simple. Esta idea está motivada por el hecho de que algunos
patrones binarios ocurren más comúnmente en imágenes de textura que otros. Un patrón
binario local se denomina uniforme si el patrón binario contiene como máximo dos
transiciones 0-1 o 1-0. Por ejemplo, 00010000 (2 transiciones) es un patrón uniforme, pero
01010100 (6 transiciones) no lo es. En el cálculo del histograma LBP, el histograma tiene
un intervalo separado para cada patrón uniforme, y todos los patrones no uniformes se
asignan a un único intervalo. Usando patrones uniformes, la longitud del vector de
características para una sola celda se reduce de 256 a 59. Los 58 patrones binarios
uniformes corresponden a los enteros 0, 1, 2, 3, 4, 6, 7, 8, 12, 14, 15 , 16, 24, 28, 30, 31,
32, 48, 56, 60, 62, 63, 64, 96, 112, 120, 124, 126, 127, 128, 129, 131, 135, 143, 159, 191 ,
192, 193, 195, 199, 207, 223, 224, 225, 227, 231, 239, 240, 241, 243, 247, 248, 249, 251,
252, 253, 254 y 255.
Bibliografía:
- https://web.archive.org/web/20050212221020/http://www.dsprelated.com/comp.dsp/ke
yword/Autocorrelation.php
- http://www.ehu.eus/Procesadodesenales/tema8/corre1.html#:~:text=CORRELACI%C3%9
3N%20CRUZADA%20Y%20AUTOCORRELACI%C3%93N.&text=Frecuentemente%20en%20
el%20procesado%20digital,entre%20dos%20procesos%20o%20se%C3%B1ales
- http://mathworld.wolfram.com/Cross-Correlation.html