Los seguidores de Manolo

No podés hacer guita en el casino (bajo ciertas hipotesis…)

In Probabilidad y Estadística on Miércoles 25, febrero, 2009 at 5:36 pm

por Pablo Lessa

Es obvio que se puede hacer guita en el casino. La mejor forma de hacerla es siendo dueño del mismo. La segunda mejor es jugar a un juego de azar en las que uno tiene las de ganar (por ejemplo si tenés buena memoria y concentración el blackjack puede ser un juego así) claro que en ese caso lo más probable es que te rajen.

También podés hacer guita si vas y jugás a un juego de azar en el que tenés las de perder, ponele jugas a la ruleta (supongamos que la ruleta está bien construida de manera de evitar la gran Jagger).

Lo que voy a intentar argumentar entonces es que, si jugás juegos de azar en las que tenés la de perder, utilizando alguna estrategia del estilo “si llego a tanta plata paro”.  Entonces en promedio vas a salir con menos plata de la que empezaste.

Modelo Básico

El modelo básico es el  siguiente:

  • \Omega es un cierto espacio de probabilidad con una cierta \sigma-álgebra (que no nos interesa) y una medida de probabilidad P.
  • X_k: \Omega \to \mathbb{R} es la variable aleatoria (función medible) que representa cuanta guita tenés si deciste seguir apostando luego de k apuestas (supongamos para simplificar que X_0 es constante y es tu plata inicial).

Lo anterior esta motivado como modelo en este artículo.  Básicamente la filosofía es que el azar determina un cierto \omega \in \Omega que no conocemos y nuestra plata en la k-ésima apuesta sería X_k(\omega).  Sin embargo como desconocemos \omega solo podemos hablar de las probabilidades de que X_0(\omega),\ldots,X_k(\omega) cumplan ciertas propiedades (por ejemplo podemos hablar de la probabildad de tener más plata en el paso k que cuando empezamos).

Esperanza Condicional

La hipótesis de que los juegos están desbalanceados en tu contra se traduce en:

E(X_{k+1} | X_0,X_1,\ldots,X_k) \le X_k

Lo cual intenta decir que el valor esperado de tu plata si decidís apostar la vez k+1-ésima es menor o igual que tu plata antes de apostar.

E(X_{k+1} | X_0, X_1, \ldots, X_k) es el valor esperado de X_{k+1} dados los valores de las variables anteriores.  Su valor depende de los valores de X_0,\ldots, X_k.  De hecho en nuestro caso es simplemente g(X_0,\ldots,X_k) donde g(x_1,\ldots,x_k) = E(X_{k+1}|X_1 = x_1,\ldots,X_k = x_k) (el valor medio de X_{k+1} en el conjunto donde las anteriores X_i toman los valores x_i).

Esta condición es más fuerte que simplemente E(X_{k+1}) \le E(X_k) porque la esperanza condicional es igual a la esperanza de la variable.

Cuando dejar de apostar

¿Ahora como se formaliza la estrategia que decide cuando parar de apostar?

Supongamos que \tau es el tiempo en el que decidimos dejar de apostar.   Dado que el valor de \tau puede depender del azar (porque podemos hacer una estrategia del tipo: “la primera vez que tenga más guita que con la que empecé me voy”) lo mejor es modelar de modo que \tau: \Omega \to \mathbb{R}.

La otra condición es que nuestra estrategia no puede depender de los resultados de apuestas futuras (si conocemos el futuro obviamente vamos a poder hacer guita).  Esto se formaliza diciendo que para cada n el evento \{\tau = n\} (abreviación para el conjunto de los \omega \in \Omega tales que \tau(\omega) = n)  se escribe como \cap_{k \le n} \{X_k \in A_k\} para ciertos A_k \in \mathbb{R} (esto significa que para decidir si parar o no alcanza con verificar si las apuestas anteriores cumplen cierta condición).

Lo anterior es la definición de “Tiempo de Parada”.

Por último nos queda decir cual es la variable aleatoria que nos da la plata con la que nos vamos al aplicar la estrategia \tau.  Esta variables se llama X_\tau y se define de modo que coincide con X_n exáctamente en el conjunto donde \tau = n (tener esto para cada n nos define X_\tau).

No podes hacer guita

Tenemos en la situación que venimos describiendo bastante laboriosamente el siguiente teorema debido a Doob (que era un tipo que se iba a dedicar al análisis armónico pero durante la guerra no había guita para eso, al final consiguió un cargo haciendo probabilidad y estadística justo cuando Kolmogorov inventó la manera de formalizar la teoría, así que este tipo se hizo terrible carrera formalizando en pila de teoremas que básicamente eran conocidos pero informalmente… ¡lo cual me parece excelente!… además todo termina con un final feliz cuando al final de su carrera encuentra que la probabilidad y el análisis armónico tienen en pila que ver y termina escribiendo un libro “Classical Potential Theory and Its Probabilistic Counterpart” que la rompe según dicen).

Teorema de Parada Opcional de Doob

Sean X_k variables aleatorias tales que E(X_{k+1}|X_0,\ldots, X_k) \le X_k y sea \tau un tiempo de parada acotado.

Entonces se cumple que E(X_\tau) \le X_0

Demostración (bosquejo). Primero quiero hacer notar que la hipótesis de que \tau sea acotada no es escencial.  Se puede cambiar por otro montón de hipótesis y se llega a la misma conclusión.

Esto da lugar a un montón de “Teoremas de Doob” y todos se demuestran de la misma forma.

Se define la variable X^\tau_k que coincide con X_k si \tau \ge k y con X_\tau si \tau < k.  Esto se llama el “proceso parado” representa la guita que tenés en el tiempo k aplicando la estrategia (se estanca en un valor cuando decidimos parar).

Se calcula con la definición de esperanza condicional y se prueba:

E(X^\tau_{k+1}) \le E(X^\tau_k) \le E(X^\tau_0) = E(X_0) = X_0

Luego se utiliza un argumento de convergencia (convergencia dominada por ejemplo) para probar que E(X^\tau_{k}) \to E(X_\tau) lo cual en nuestro caso es trivial ya que como \tau es acotada se tiene X^\tau_N = X_\tau para todo N suficientemente grande.\Box

Sobre duplicar hasta ganar

Este teorema me resulta bastante satisfactorio ya que una vez desenredados los tecnisismos (cosa que a plena conciencia fracasé en hacer en este artículo, especialmente en lo que respecta a la esperanza condicional que es un concepto dificil de formalizar) dice lo que uno siempre quiso demostrar… que apostar a juegos de esperanza negativa (como la ruleta o el 5 de oro) no puede dar dividendos a la larga, sin importar que tipo de estrategia complicada del estilo “duplicar hasta ganar” apliquemos.

Justo esa estrategia de duplicar hasta ganar parece contradir el teorema ya que X_\tau siempre vale mayor que X_0 (cuando por fin ganamos una, tenemos más plata que la que empezamos) y por lo tanto si pudieramos aplicar esta estrategia ganariamos guita con probabilidad 1.

Lo primero a notar es que:

\tau = \text{ el tiempo que demoro en ganar una apuesta }

no está acotada y por lo tanto no podemos aplicar el teorema.  En particular esto significa que para aplicar esta estrategia hay que ser inmortal.

Sin embargo, podemos analizar la estrategia “duplico hasta ganar una vez o hasta perder 1 millón de veces seguidas” y el resultado de aplicar el teorema es que X_\tau (que toma solamente los valores 2X_0 y X_0 - (1+2 + \cdots + 2^{1000000})X_0) tiene esperanza menor o igual que X_0.  Con esto podemos acotar la probabilidad de terminar ganando y vemos que con cierta probabilidad ganamos X_0 y con otra probabilidad (mucho menor) terminamos endeudados hasta el ojete y nos vienen a buscar los prestamistas de maroñas para rompernos las gambas.

Alguno podrá decir bueno “ta pero tengo probabilidad 1 - 2^{-N} de irme ganando algo… ¡me arriesgo!”

A este peligrosamente inocente gil de miga hay que explicarle que en el anterior análisis permitimos apuestas cada vez más zarpadas sin cota, lo cual en los casinos no se permite… si limitamos el monto máximo de la apuesta a realizar (aún asumiendo que somos inmortales y que tenemos crédito infinito para bancar malas rachas) el Teorema de Doob (en cierta variante con hipótesis E(\tau) < +\infty en lugar de \tau acotada) se aplica y da que el valor esperado de X_\tau es menor o igual a X_0…. como era de esperar.

  1. Un comentario que me parece que puede llegar a servir. Sobre la diferencia entre E(X_n|X_0, \ldots, X_{n-1})\leq X_{n-1} y E(X_n)\leq E(X_{n-1}) me parece que la diferencia es que la primera condicion es como mas “local”, como que la segunda es el promedio. Es decir, en la primera decis que sin importar que haya pasado hasta ahora, esperas tener menos la siguiente vez, y la segunda dice, que si promedias entre todas las cosas que pasaron, en la mayoria de las situaciones vas a salir perdiendo. Creo….

    Y ya que estoy sigo rompiendo un poco con la esperanza condicional. En este caso, de alguna manera X_{n-1} lleva “toda” la informacion importante del pasado, no?. Entonces, no sera lo mismo condicionar solamente a X_{n-1}?

    Ultima cosa, X_0 es constante, lo cual es obvio, pero como me llevo un rato darme cuenta lo escribo aca.

  2. La esperanza condicional a veces es desesperante.

    Estoy de acuerdo con tu concepto de que la esperanza condicional da más información “local” que simplemente la media. Dice algo sobre como se “construye” la variable nueva dadas las anteriores.

    Puede verse que E(X_n|X_0,\cdots,X_{n-1}) es la función de X_0,\cdots,X_{n-1} que mejor predice a X_n. El sentido preciso es que minimiza la distancia en L^2 en caso de que todas las variables esten en este espacio.

    Aún en nuestro caso es posible que se pueda predecir mejor a X_n conociendo a todos X_0,\cdots, X_{n-1} que si sólamente conocemos a X_{n-1}. Un ejemplo de esto (aunque claramente artificial) se da si nuestra apuesta n-ésima es un pleno a la ruleta si ganamos la apuesta X_1 y un color en la ruleta si perdimos dicha apuesta.

    En esa construcción se verifican las hipótesis del teorema, y la esperanza condicional va terminar siendo función de X_1 y X_{n-1}.

    Igual un montón de procesos interesantes como los paseos al azar en \mathbb{Z}^d cumplen la propiedad que decis (que el mejor predictor es la variable anterior). Creo que se estudian sistemáticamente y se llaman “Procesos de Markov”, aunque en la wikipedia la definición es un poco distinta a lo que estamos discutiendo.

  3. Impecable, entendi eso de las estrategias… con lo cual el resultado es mas general de lo que pensaba, siempre tengo problema con las esperanzas esas.

    Sobre la ultima parte de lo que escribiste, puede ser que la esperanza del tiempo de parada sea infinita cuando queres duplicar hasta ganar?

  4. Nop.

    La variable que cuenta cuantos pasos tuviste que esperar para ganar por primera vez tiene la clásica distribución geométrica. El valor esperado es 1/p donde p es la probabilidad de ganar en un paso.

    En el caso de duplicar hasta ganar la hipótesis que no se cumple es que las apuestas son no acotadas. Bajo esas condiciones sería posible ganar guita con probabilidad 1. Lo que pasa es que estas asumiendo que sos inmortal y podés pedir una cantidad ilimitada de crédito (para bancar las malas rachas que van a venir con probabilidad 1).

    Para los meros mortales con cantidad finita de credito, se aplica el teorema de Doob.

  5. […] puede ser interesante mirar la demostración del teorema de parada opcional de Doob que bosqueje en este artículo. […]

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: