Los seguidores de Manolo

Distribuciones de Probabilidad Estables (un bosquejo)

In Probabilidad y Estadística on Jueves 12, marzo, 2009 at 2:56 pm

por Pablo Lessa

El teorema central del límite clásico dice:

Teorema Central del Limite.

Si X_1, \ldots, X_n, \ldots son variables aleatorias independientes e idénticamente distribuidas y tales que:

E(|X_n|) < +\infty

E(|X_n|^2) < +\infty

entonces definiendo

S_n = X_1 + \cdots + X_n

E(X_n) = \mu

E((X_n-\mu)^2) = \sigma^2

se tiene que  para todo a,b \in \mathbb{R} con a < b se tiene:

P(\frac{1}{\sqrt{n}\sigma}(S_n - n\mu) \in [a,b]) \to \frac{1}{\sqrt{2\pi}}\int_a^be^{-\frac{x^2}{2}}\mathrm{d}x

La hipótesis de que las variables sean de cuadrado integrable es escencial y tenemos el siguiente ejemplo:

Distribución de Cauchy.

La distribución de Cauchy de mediana \mu \in \mathbb{R} y escala \gamma > 0 es la medida de probabilidad en \mathbb{R} cuya densidad está dada por:

\frac{1}{\pi\gamma}\frac{1}{1 + (\frac{x - \mu}{\gamma})^2}

Puede verificarse que la densidad dada efectivamente integra 1 y por lo tanto define una probabilidad en \mathbb{R}.  Sin embargo bajo esta medida la función x \mapsto x^2 no tiene integral finita y por lo tanto cualquier variable aleatoria con distribución de Cauchy no cumplirá las hipótesis del teorema central.

De hecho si X_1, \ldots, X_n, \ldots con distribución de cauchy de mediana {}0 y escala 1 se tiene que para todo n:

\frac{1}{n} S_n

tiene distribución de Cauchy con la misma mediana y escala.

En particular esto implica que fijado cualquier intervalo [a,b] \in \mathbb{R} se tiene:

P(\frac{1}{\sqrt{n}}S_n \in [a,b]) = P(\sqrt{n} \frac{1}{n}S_n \in [a,b]) = P(X_1 \in [\frac{a}{\sqrt{n}}, \frac{b}{\sqrt{n}}]) \to 0

cuando n \to +\infty.  De modo que no se cumple la tesis del teorema central del límite para esta sucesión de variables aleatorias independientes.

Distribuciones Con Cuenca de Atracción

Las distribuciones estables son aquellas que, como la Cauchy y la Normal, tienen un “teorema central del límite” en el siguiente sentido:

Definición (Distribución con Cuenca de Atracción).

Una distribución de probabilidad Q se dice que posee una cuenca de atracción, si existen dos sucesiónes de reales a_n > 0, b_n \in \mathbb{R} y una sucesión de variables aleatorias independientes e idénticamente distribuidas X_1, \ldots, X_n, \ldots tales que:

P(a_n S_n + b_n \in [a,b]) \to Q([a,b])

para todo intervalo [a,b] \in \mathbb{R}.

La distribución normal posee en su cuenca de atracción a todas las distribuciones de cuadrado integrable y en ese caso a_n = \frac{1}{\sqrt{n}} (la sucesión b_n varia según el caso como se ve en el enunciado del teorema central).

La distribución de Cauchy (aunque no es obvio) además de tenerse a si misma en su cuenca de atracción tiene otras distribuciones y el factor que funciona es a_n = \frac{1}{n} o equivalentes (una vez más b_n dependerá del caso).

Distribuciones Estables

Una suma de variables normales (0,1) independietes tendrá distribución normal (0,n).  Dividiendo esta suma entre \sqrt{n} se obtiene una normal (0,1).

De modo análogo, una suma de variables de Cauchy (0,1) independientes es una variable de Cauchy (0,n).  Dividiendo esta suma entre n se obtiene una variable de Cauchy (0,1).

Capturamos esta propiedad de las distribuciones en la siguiente definición:

Definición (Distribución Estable).

Una distribución Q es estable si existen dos sucesiónes numéricas a_n > 0, b_n \in \mathbb{R} tales que si X_1, \ldots, X_n, \ldots son independientes de distribución Q se tiene que:

a_n S_n + b_n

tiene distribución Q para todo n.

Si una distribución es estable trivialmente tiene cuenca de atracción (de hecho está en su propia cuenca de atracción).  Lo que no es tan trivial pero sigue siendo cierto es el recíproco:

Teorema.

Sea Q una distribución de probabilidad.  Si existe una distribución R en la cuenca de atracción de Q entonces la distribución Q es estable.

Idea Para la Demostración.

Hay una demostración clásica del anterior teorema que es razonablemente corta y no muy iluminadora.

Con rpotrie discutimos una posible demostración alternativa que estaría basada en el siguiente hecho trivial:

Lema (los puntos con cuenca son fijos).

Si f: X \to X es continua y x,y \in X son tales que f^n(x) \to y entonces f(y) = y.

Para conectar estas dos cosas ideamos los siguiente pasos:

  1. Se considera \mathcal{P} el espacio de todas las probabilidades borelianas en \mathbb{R} con la topología de la convergencia debil (i.e. la que aparece en el teorema central).
  2. Decimos que dos distribuciones Q,R son equivalentes si existen a > 0, b \in \mathbb{R} tal que si X tiene distribución Q entonces aX + b tiene distribución R.
  3. Tomamos el espacio [\mathcal{P}] de las clases de equivalencia con la topología cociente.  En este paso hay que eliminar de X todas las distribuciones \delta ya que están artbitrariamente cerca de cualquier clase (porque multiplicar una variable por a > 0 muy chico la hace escencialmente constante).
  4. Se define f_n: [\mathcal{P}] \to [\mathcal{P}] que asigna a una distribución Q la distribución de la suma de n variables independientes de distribución Q.  Hay que ver que no depende del representante.  Se tiene f_{n^k} = f_n^k.
  5. Se traducen las definiciónes Q estable implica f_n([Q]) = [Q] para todo nQ tiene cuenca de atracción implica que existe R tal que f_n([R]) \to [Q].
  6. Si R está en la cuenca de Q entonces para cada n fijo f_n^k([R]) = f_{n^k}([R])\to [Q] cuando k \to +\infty y por lo tanto f_n([Q]) = [Q] (el lema trivial).  Esto a su vez implica que Q es estable, lo cual concluye la demostración.

Falta entender y formalizar varios pasos para llevar adelante el plan.  Sin embargo creo que está escencialmente bien. ¿Ustedes que opinan?

  1. Me gusto la idea de que sea estable implica que f_n([R]) \to [Q] para todo n.

    Eso ahorra un argumento largo que habiamos pensado (que hacia la prueba mas parecida a la clasica).

    Parece funcionar, no?

  2. Pa… no les gusto mi formula. Me referia a que f_n (R) \to Q para todo n. Espero que ahora salga.

  3. Te arregle el primer comentario… el problema es que el latex de acá es medio trucho, en particular cualquier espacio extra y lo más probable es que no compile.

    El tao (cuando no?) hizo un aporte también en esta trivialidad, recopilando una lista de problemas con el latex de wordpress.

    Aclarando respecto a las equivalencias.

    Que exista R tal que f_n([R]) \to [Q] cuando n \to +\infty es equivalente a que Q tenga cuenca de atracción (en principio no que es estable).

    Que Q sea estable es equivalente a que [Q] sea punto fijo de f_n para todo n.

    El pasaje de una cosa a la otra, una vez armado todo el tinglado, es el lema trivial.

  4. Extrañamente parece que pude encontrar (la transformada de fourier de) una distribución de probabilidad que es punto fijo para f_2 pero no para f_3.

    Además con el Rata nos parece que tenemos una prueba de que si una distribución es punto fijo de f_2 y de f_3 entonces es punto fijo de toda f_n (es decir la distribución es estable).

  5. Ser punto fijo de f_k no implica ser “punto periodico” de periodo k? Eso implicaria que ser fijo de f_2 y f_3 sea lo mismo que ser fijo por f_n para todo n.

  6. Estoy usando estos comentarios para ordenarme un poco.

    La topología que necesitamos sobre las clases tiene que cumplir:

    [Q_n] \to [P] si y solo si existen a_n > 0, b_n \in \mathbb{R} tales que: a_nQ_n + b_n \to P (la notación a_nQ_n + b_n es malísima… representa la medida que se obtiene al reescalar y trasladar la medida Q_n).

    Creo que se puede metrizar mediante alguna variante de la distancia de Prokhorov-Levy.

    La variante debería resolver el problema de que toda clase está arbitrariamente cerca (en distancia de Prokhorov) a la clase de las distribuciones delta.

  7. Gordo:

    Estaba con una versión vieja de la página y no vi tu comentario antes de escribir el comentario anterior (ahora hice refresh y apareció el tuyo entre medio).

    Es extraño, pero viste que f_{n+2} \neq f_2\circ f_n y por lo tanto no es lo mismo ser punto fijo de f_2 que ser punto fijo de f_{2n} para todo n.

    De hecho ser punto fijo de f_2 lo que implica es que f_{2n}([P]) = f_n([P]) para todo n. En particular sos punto fijo en las potencias de 2. Y sos periódico de periódo 2 (o 1) para f_3.

    En fin, al final el “sistema dinámico que pinta” es un montón de mapas que cumplen: f_{nm} = f_n \circ f_m = f_m\circ f_n
    Una especie de acción de los naturales con la multiplicación.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: