lunes, 6 de mayo de 2013

FUNCIÓN DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA DISCRETA

FUNCIÓN DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA DISCRETA





DISCRETA
 La variable aleatoria X se dice que es discreta si los números
asignados a los sucesos elementales de E son puntos aislados. Sus posibles
valores constituyen un conjunto finito o infinito numerable. Por ejemplo,
supongamos el experimento consistente en lanzar tres veces una moneda no
trucada; si consideramos la variable aleatoria X=”número de caras obtenidas en
los tres lanzamientos”, los valores que puede tomar esta variable aleatoria son
finitos (0,1,2,3).

 CONTINUA:

La variable aleatoria X será continua si los valores asignados
pueden ser cualesquiera, dentro de ciertos intervalos, es decir, puede tomar
cualquier valor de R. Por ejemplo, si consideramos el experimento aleatoria
consistente en medir el nivel de agua en un embalse y tomamos la variable
aleatoria X=”nivel de agua”, esta puede tomar valores entre 0 y más infinito


Una variable aleatoria es una funci on que asigna un n umero a cada suceso elemental de un
experimento aleatorio.
Cualquier variable estad stica cuantitativa estudiada en los temas 1 a 3 podr a considerarse
variable aleatoria con la condici on de que est e observada en todos los individuos de una poblaci on.
La media de una variable aleatoria X se denota por x. En el caso en el que no exista la
posibilidad de confusi on respecto de la variable aleatoria con la que estamos trabajando, la media se
denotar a solamente por . A la media de una variable aleatoria X tambi en se le llama esperanza
matem atica de X, denot andola entonces por E(X).
La varianza de una variable aleatoria X se denota por Var(X), por
.
Por tanto, la desviaci on t pica de una variable aleatoria X se denota por x o por .
La funci on de distribuci on de una variable aleatoria X se denota por FX o simplemente por
F y se de ne de la siguiente forma:
FX(t) = P(X t) para todo t


CLASIFICACION DE LAS VARIABLES ALEATORIAS:
Variable aleatoria discreta: s olo puede tomar valores num ericos aislados ( jados dos con-
secutivos, no puede existir ninguno intermedio).
 Variable aleatoria continua: puede tomar cualquier valor num erico dentro de un intervalo,
de modo que entre cualesquiera dos de ellos siempre existe otro posible valor.
5.1.2. Variables aleatorias discretas
Identi caci on de una variable aleatoria discreta X: es preciso conocer el conjunto de
los posibles resultados de X:
fx1; x2; : : : ; xk; : : :g
y el conjunto de las probabilidades siguientes:
p1 = P(X = x1)
p2 = P(X = x2)
.
.
.
pk = P(X = xk)






PROBABILIDA PARA LA VARIABLE ALEATORIA Y DISCRETA
Variable aleatoria discreta
Se denomina variable aleatoria discreta aquella que sólo puede tomar un número finito de valores dentro de un intervalo. Por ejemplo, el número de componentes de una manada de lobos, pude ser 4 ó 5 ó 6 individuos pero nunca 5,75 ó 5,87. Otros ejemplos de variable discreta serían el número de pollos de gorrión que llegan a volar del nido o el sexo de los componentes de un grupo familiar de babuinos.
Variables aleatorias discretas

Distribución uniformeLa distribución uniforme es la que corresponde a una variable que toma todos sus valores, x1, x2... , xk, con igual probabilidad; el espacio muestral debe ser finito.

Si la variable tiene k posibles valores, su función de probabilidad sería:
donde k es el parámetro de la distribución (un parámetro es un valor que sirve para determinar la función de probabilidad o densidad de una variable aleatoria)
La media y la varianza de la variable uniforme se calculan por las expresiones:

             El histograma de la función toma el aspecto de un rectángulo, por ello, a la distribución uniforme se le suele llamar distribución rectangular.
Densidad
Se denomina densidad discreta a la probabilidad de que una variable aleatoria discreta X tome un valor numérico determinado (x). Se representa:
f(x) = P[X=x]
La suma de todas las densidades será igual a 1
Una función que asocia un número real, perfectamente definido, a cada punto muestral.
A veces las variables aleatorias (v.a.) están ya implícitas en los puntos muestrales.
Ejemplos:  
1.      Experiencia consistente en medir la presión sistólica de 100 individuos. Un punto muestral (resultado de un experimento) es ya un número (presión sistólica). La v.a. está implícita.
2.       En el ejemplo de la mujer portadora de hemofilia.
W = {sss, ssn, sns, snn, nss, nsn, nns, nnn}
Se podría definir una variable que asignara a cada punto muestral el número de orden en el espacio muestral.
X: sss 1; ssn 2; sns 3;...
Pero otra posible v.a.: a cada punto muestral el número de s. X: sss 3; ssn 2; ...
3.      Tiramos una moneda 3 veces. Representamos cara por c y cruz por z.
W = {ccc, ccz, czc, zcc, czz, zcz, zzc, zzz}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc)=1/8, ya que la probabilidad de sacar cara en una tirada es 1/2 según la definición clásica y las tiradas son independientes.
Definimos la v.a. X: número de caras, que puede tomar los valores {0, 1, 2, 3}. Se buscan todos los puntos muestrales que dan lugar a cada valor de la variable y a ese valor se le asigna la probabilidad del suceso correspondiente.
x
Sucesos
px
0{zzz}1/8
1{czz, zcz, zzc}3/8
2{ccz, czc, zcc}3/8
3{ccc}1/8

4.      Supongamos la variable tipo histológicode un tumor, con los valores 1, 2, 3, 4. Si la fdp fuera
x
f(x)
10,22
20,27
30,30
40,21

Significaría que la probabilidad del tipo 2 es 0,27, etc.
Para variables continuas la probabilidad de que una variable tome cualquier valor concreto es 0, por lo tanto la fdp sólo permite calcular la probabilidad para un intervalo del tipo (a<X<b), mediante el área bajo la curva de la fdp.
Se tira un dado. Se define como v.a. el número que sale ¿Cuál es su media?
La variable X puede tomar los valores 1, 2, ..., 6 y para todos ellos f(x) = 1/6. En consecuencia la media es
Observese que es un número que la v.a. no puede alcanzar. ¿Qué significa? No mucho.
Se define ahora una función sobre X: el premio: si sale 1 ó 2 se gana 100 ptas, si sale 3 se gana 500 y si sale 4, 5 ó 6 no se gana nada
Xh(x)
1100
2100
3500
40
50
60
¿Cuál es el valor medio de esta función?
¿Qué significa? es el valor medio a la larga: si se juega un número grande de veces la ganancia final es como si en cada jugada se hubiera ganado 116,6 pts. Si la apuesta costara menos de eso el juego sería ventajoso para el jugador (así se enriqueció Voltaire), si costara más, para la banca. (llamar a ésto honestidad del juego le costó el puesto de ministro a Laplace).
Varianza:
Se define como:
Aunque para el cálculo se suele usar esta otra fórmula equivalente:

Los conjuntos pueden ser:
Discretos: número finito o infinito numerable de elementos.
Continuos: número infinito no numerable de elementos.
Las v.a. definidas sobre espacios muestrales discretos se llaman v.a. discretas y las definidas sobre espacios muestrales continuos se llaman continuas.
Una v.a. puede ser continua, aunque nosotros sólo podamos acceder a un subconjunto finito de valores. P.e. la presión arterial es una v.a. continua pero sólo podemos acceder a un conjunto finito de valores por la limitación de los aparatos de medida.
En general, las medidas dan lugar a v.a. continuas y los conteos a v.a. discretas.
Las v.a permiten definir la probabilidad como una función numérica (de variable real) en lugar de como una función de conjunto como se había definido antes
A esta función se le denomina función densidad de probabilidad (fdp), que desgraciadamente "funciona" de distinta manera en las variables discreta que en las continuas. En el caso de las variables discretas, como en el ejemplo, es una función que para cada valor de la variable da su probabilidad.

Para las variables aleatorias de interés hay tablas, y programas de ordenador, donde buscar esos valores.
Distribución acumulativa o función de distribución
F(x) = p(X £ x)
Parámetros característicos de una fdp
Valor esperado o esperanza matemática o media
si X es una v.a. cualquier función de ella, h(x), es también una v.a., en consecuencia también se define este parámetro para una función de v.a.
Variable aleatoria continua 
             La distribución normal fue definida por De Moivre en 1733 y es la distribución de mayor importancia en el campo de la estadística.
Una variable es normal cuando se ajusta a la ley de los grandes números, es decir, cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas causas de efecto infinitesimal.
Las variables normales tienen una función de densidad con forma de campana a la que se llama campana de Gauss.
Su función de densidad es la siguiente:

Los parámetros de la distribución son la media y la desviación típica, μ y σ, respectivamente. Como consecuencia, en una variable normal, media y desviación típica no deben estar correlacionadas en ningún caso (como desgraciadamente ocurre en la inmensa mayoría de las variables aleatorias reales que se asemejan a la normal.
La curva normal cumple las siguientes propiedades:
1)     El máximo de la curva coincide con la media.
2)     Es perfectamente simétrica respecto a la media (g1 = 0).
3)     La curva tiene dos puntos de inflexión situados a una desviación típica de la media. Es convexa entre ambos puntos de inflexión y cóncava en ambas colas.
4)     Sus colas son asintóticas al eje X.
             Para calcular probabilidades en intervalos de valores de la variable, habría que integrar la función de densidad entre los extremos del intervalo. por desgracia (o por suerte), la función de densidad normal no tiene primitiva, es decir, no se puede integrar. Por ello la única solución es referirse a tablas de la función de distribución de la variable (calculadas por integración numérica) Estas tablas tendrían que ser de triple entrada (μ, σ, valor) y el asunto tendría una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una correspondencia de sus valores con los de otra variable con distribución normal, media 0 y varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas variables se obtiene mediante la ecuación:          
La función de distribución de la variable normal tipificada está tabulada y, simplemente, consultando en las tablas se pueden calcular probabilidades en cualquier intervalo que nos interese.
             De forma análoga a lo pasaba con las variables Poisson, la suma de variables normales independientes es otra normal.
Histograma de una normal idealizada
Histograma de una muestra de una variable normal

No hay comentarios:

Publicar un comentario