miércoles, 21 de abril de 2010

Caso No. 12: "Cómo ganar..."



"Classes will dull your mind, destroy the potential for authentic creativity."
John Nash


Durante la sesión de esta semana se abordó como tema la teoría de juegoss, principalmente. Antes de comenzar con el contenido teórico, comencemos con una breve descripción de esta área, y fiel a la costumbre de un servidor, comencemos con un caso práctico de estudio.

Supongamos que cierto día nos levantamos por la mañana, y el cielo está nublado, a lo lejos se escuchan las gotas de agua cayendo al piso, el clima está fresco, y las cobijas manteniendo estable nuestra temperatura corporal, es decir, las condiciones perfectas para: “hoy sí que no me levanto”. De pronto, el equilibrio se rompe cuando volteo a ver el calendario y veo que… hoy es martes!!! Y el reloj despertador, cómplice del calendario, me dice que son… las 7:00 a.m.!!! Se me ace tarde para la clase de simulación de sistemas!!!

A partir de esta situación, se generan una serie de eventos en las que tengo que decidir constantemente qué es lo que más me conviene hacer a continuación, aunque sea de manera inconsciente. Lo primero que se me ocurre (casi casi a diario) es: opción a. bajo a desayunar y luego me baño, opción b. me baño y luego bajo a desayunar. Primera decisión que tomo en el día: opción b, me baño y luego bajo a desayunar. Por qué? Bueno, porque el clima está fresco y si salgo instantáneamente rumbo a la Universidad recién bañado es probable que me enferme, así que mejor me baño, y mientras desayuno “reposo” el baño.

Pasa un tiempo y se presenta entonces la segunda encrucijada (aunque sea precedida por una serie de decisiones inconscientes): llevo prisa, así que: opción a. manejo a 120 kmph, opción b. manejo a 80 kmph. Rápidamente evalúo la probabilidad de llegar sano y salvo conduciendo a 120 kmph, y son muy buenas. Pero olvido añadirle a mis cálculos la impertinencia del resto de conductores en nuestra ciudad, así que lo hago, y la probabilidad es realmente baja. Así que, me voy por la opción b, manejo a 80 kmph y me arriesgo a perder los primeros puntos de la semana en clase.

Este par de decisiones las he tomado únicamente haciendo una estimación empírica y rápida del suceso inmediato que se desencadena seleccionando una u otra opción, en mi beneficio personal. Bastante sencillo, no? Conozco lo que me podría suceder si selecciono la opción a o la opción b, y simplemente selecciono la opción que más me conviene a mí, la que me da más beneficio.

A este par de decisiones seguramente le seguirán decenas o centenas de eventos en donde necesito decidir entre una opción u otra, y seguramente también, volveré a aplicar el mismo criterio: lo que más me convenga. Ahora bien, qué sucede si mi hermano, que asiste a la preparatoria, se levanta bajo las mismas circunstancias y en mi casa hay exclusivamente una regadera? Seguramente pensará de manera semejante, y querrá bañarse primero, porque es lo que a él más le conviene.

A raíz de esto, cada uno sigue con sus opciones personales: opción a. bañarse antes de desayunar y opción b. desayunar antes de bañarse, pero ahora como un grupo colectivo, tenemos nuevas opciones, digamos para simplificar: opción c. enfrascarnos en una disputa por la regadera hasta que uno de los dos se harte y ceda, opción d. echar un volado para ver quién se baña primero.

Debe estar el lector de acuerdo, que tanto a mi hermano como a un servidor nos conviene bañarnos primero (claro, suponiendo que somos propicios a enfermarnos y esta razón es bastante fuerte) y luego desayunar. Lamentablemente, no existe más que una regadera y si queremos salir de la casa bañados, tenemos que decidir entre c y d.

Pero, claramente vemos como la opción c nos podría beneficiar a él o a un servidor, si uno de los dos se retira rápidamente, pero también nos podría perjudicar a los dos, si nos enfrascamos en una batalla campal que termina con nuestro tiempo disponible para el aseo personal; mientras tanto, la opción d nos ofrece una alternativa fácil y que seguramente beneficiará a alguno de los dos, y el que no resulte beneficiado aún tendrá tiempo de bañarse, siendo entonces menos perjudicial que la parte negativa de la opción c.

Claramente, como grupo, nos conviene irnos directamente con la opción d en donde existe la probabilidad de bañarse en segundo, pero como individuos, quisiéramos ir por la opción a y bañarnos primeros. Entonces tenemos un gran dilema presente: hacer lo que es mejor para el grupo, o para el individuo?

Precisamente, preguntas como está son abordadas directamente por la teoría de juegos. Como juego debe entenderse, por lo menos en este contexto, las interacciones que se desarrollan a causa de un incentivo establecido. Podemos definir entonces formalmente la teoría de juegos como un método matemático para la toma de decisiones en donde se analizan posibles situaciones o estrategias que compiten entre sí (interacción), para determinar la decisión óptima.

Algo parecido se presentó en la excelente película A Beautiful Mind, en donde se presenta una escena con Nash y sus colegas en un bar, y en la forma en que van a conquistar a la mujer más atractiva del lugar, que se encuentra con su grupo de amigas menos atractivas. Nash cuenta entonces que, como individuos, cada uno quisiera irse directamente sobre la mujer atractiva, pero seguramente no le hará caso a ninguno por abalanzarse todos al más puro estilo de la supervivencia del más fuerte, y ante la negativa, el resto del grupo de amigas los rechazarán también por sentirse el “plato de segunda mesa”. Sin embargo, anticipa también que trabajando como un grupo, y acercándose al resto del grupo, todos terminarán con pareja.

Generalizando este concepto, un conjunto de individuos intentando alcanzar el óptimo, o la decisión de mayor beneficio individual, conducirá a una serie de fracasos para la mayor parte de los individuos. Por otro lado, trabajando como un grupo e intentando alcanzar un semi-óptimo, se obtiene el mejor beneficio grupal.

Volviendo a la teoría de juegos, la definición que presentamos nos hace intuir que tenemos un escenario con una cantidad de individuos que pueden tomar decisiones, por lo que deben “saber” lo que un cambio en su accionar trae consigo, y cuya interacción es en extremo importante, ya que la decisión que tome un individuo impacta positiva o negativamente al resto.

El juego estratégico es entonces el modelo central de esta teoría de juegos, proporcionando la información relevante de una manera adecuada para su análisis. Esta captura de información se refiere a la interacción mencionada entre individuos, permitiendo que cada individuo sea afectado por las decisiones tomadas por otro y no exclusivamente por las suyas. De acuerdo a esto, los componentes básicos de un juego deben ser:

· Jugadores. Son los individuos que toman las decisiones, y deben existir al menos dos para que exista una interacción.

· Acciones. Debe existir una serie de acciones a seguir para cada jugador.

· Preferencias. Cada jugador debe tener sus acciones preferidas por encima de otras.

Al adaptar este modelo a un sistema económico, por ejemplo, diferentes compañías representan el papel de jugadores, los precios en el mercado representan las acciones y las preferencias los beneficios de las compañías. O, relacionando este nuevo caso con dinámica de poblaciones y con simulación basada en agentes, los jugadores pueden ser animales peleando por comida (o cazando), las acciones el tiempo en el cual hacen sus movimientos (acechar, abalanzarse sobre la presa,…) y las preferencias el hecho de si un animal gana o pierde (un zorro, por ejemplo, preferiría tratar de cazar un conejo en vez de un oso).

La dinámica de poblaciones, como mencionamos en su momento, estudia la tasa de variación en la cantidad de individuos que componen una población. Para esto, generalmente el aspecto macroscópico es tomar como parámetros del modelo estimaciones estadística, como lo son la tasa de mortalidad y la tasa de nacimientos, es decir que las variables aplicadas con observables y características del sistema como un todo. A pesar de ser buenos estimadores de la cantidad de individuos que mueren y nacen, respectivamente, en algunas situaciones presentan cierta inexactitud y desvía nuestros resultados de la realidad, después de todo, una media no es más que una estimación.

La simulación basada en agentes, por su parte, es útil para estudiar la estructura microscópica de un sistema. Es decir, que nos permite analizar a cada individuo de la población (o por lo menos a un grupo representativo de ella) y poder generar un perfil más adecuado de lo que sucede en el nivel macroscópico. De cierta forma, esto nos permite conocer con mayor detalle qué es lo que está sucediendo con los individuos.

La diferencia radica en que, dando información de la forma: la tasa de mortalidad por enfermedad es del 30% para infantes y ancianos, y del 15% para adultos y al momento de hacer los cálculos, todos los individuos que comparten ciertas características (en esta caso la edad) son iguales para mí, por lo que mis conclusiones son de la forma: del año i al año i+1 murieron 100 infantes y ancianos y 50 adultos. Cuáles murieron? Quién sabe! Para mí todos son iguales. Que si 25 de esos eran médicos y ayudaban a disminuir la cantidad de muertes, que si los otros 25 eran inmunes a la enfermedad de moda, son factores que afectan enormemente la tasa de mortalidad y es información que no podemos proporcionar al modelo.

Por otro lado, a nivel microscópico este tipo de información tan detallista puede introducirse en el modelo. Recuerde el lector lo que se mencionó acerca de la reacción auto-catalítica, y su diferencia entre una simulación macroscópica y una microscópica basada en agentes.

Una molécula que participa en la reacción química auto-catalítica descrita lo hace con la intención de disminuir sus niveles de energía, buscando alcanzar su nivel más estable, de acuerdo al principio de la energía mínima. Los individuos serían en este caso las moléculas tanto de reactivo como de producto, las acciones serían, para las moléculas de producto, reaccionar con una molécula de reactivo o con otra de producto, o inclusive no reaccionar si no lleva la energía cinética suficiente para vencer la energía de activación, y las preferencias estarían relacionadas con la concentración de producto en la mezcla reaccionante.

Ahora bien, haciendo uso de la simulación basada en agentes se manifiesta que los sistemas complejos son producto de comportamientos individuales y de sus interacciones, lo cual suena semejante a esto de teoría de juegos. Sin embargo, desde el punto de vista de un servidor, la diferencia existente entre ambos es el nivel de interacción que se tiene. Por ejemplo, en una simulación basada en agentes en donde un conjunto de corredores salen a trotar y entran en contacto con unos venados, los cuales corren, buscan un escondite y finalmente se esconden, tal y como se propuso en la sesión de la semana pasada, las acciones que toman los jugadores es sencilla: el corredor debe correr por donde le dé su gana, mientras que el venado debe reaccionar de la siguiente forma: si creo que el corredor viene cerca, huyo; si creo que el corredor viene demasiado cerca, huyo y conforme huyo, busco un escondite; cuando lo encuentre me escondo. La decisión debe ser seleccionar entre huir para cambiarse de lugar, y huir para ocultarse.

Mientras que el nivel de interacción en teoría de juegos es tan alto que es capaz de aplicarse al comportamiento humano, siempre bajo la tutela de que el individuo conoce todas las reglas y que realizará acciones que crea le otorgarán el beneficio máximo. La cantidad de estrategias o posibles soluciones que se pueden tener antes de tomar una decisión es una característica del comportamiento no solo humano, sino de cualquier ser vivo. El nivel de interacción es entonces lo que, a mi parecer, crea una delgada línea entre estos modelos.

Para finalizar, pongamos como ejemplo una reacción química homogénea en solución acuosa, digamos que el reactivo A me produce el producto B, y nada más. Es evidente que una molécula de A no tiene muchos caminos de donde elegir: si me encuentro con otra molécula de A, reacciono, y si no me encuentro con ninguna, pues no reacciono. Esto es algo similar a la reacción auto-catalítica presentada. Pero analicemos ahora un escenario un poco más complejo, que esta vez, tenemos dos reacciones simultáneas que pueden ocurrir dentro de nuestro reactor: reacción 1. el reactivo A reacciona con A para producir B, reacción 2. el producto B reacciona con B para producir A, es decir, tenemos una reacción reversible. Ahora la situación se ha complicado un poco, ya no es tan sencillo como tener dos alternativas. El principio de la energía mínima, planteado mediante la energía libre de Gibbs, indica que la reacción llega a un equilibrio en su potencial químico. El camino que sigue la reacción se rige entonces porque cada molécula busca el equilibrio, representado por el mínimo nivel de energía; por lo tanto, el beneficio de una molécula es tener la mínima cantidad de energía posible. Dado que se tiene un individuo que busca su beneficio personal, y se ve afectado por las “decisiones” tomadas por el resto de las moléculas (concentración), puede aplicarse la teoría de juegos.

Pero las aplicaciones de esta área no abarcan únicamente la química, al comportamiento de los seres vivientes sino que abarcan además áreas como la economía, su principal objetivo y el área para la cual nació esta teoría, por aquello de la competencia entre estrategias de diferentes empresas; la filosofía, para demostrar el comportamiento humano, y para justificar que incluso el más egoísta de los humanos puede descubrir que con frecuencia es necesario cooperar con los demás individuos por beneficio propio; e incluso en la biología, en donde la teoría de la evolución representa un claro ejemplo de un juego (la vida) en donde las decisiones que tome un individuo y las interacciones que desencadena tienen resultados tan diferentes como vivir o morir.


Aplicación de la Teoría de Juegos.

Como ejemplo práctico, se decidió programar un juego sencillo: una pelea de box, con reglas muy sencillas. El boxeador 1 tiene una probabilidad inicial del 85% de atacar, mientras que la probabilidad inicial de ataque del boxeador 2 es del 25%. Las acciones que puede tomar el jugador son representadas de la siguiente forma: postura 1. el boxeador ataca, postura 2. el boxeador se cubre.

Ahora bien, las reglas de este juego son:

Si un boxeador se cubre mientras el otro ataca, el boxeador que se cubre recibe un golpe que le produce cierto daño, mientras que el atacante eleva su nivel de cansancio.

Si ambos boxeadores se atacan, ambos obtienen un aumento en su nivel de daño y en su nivel de cansancio.

Si ambos se cubren, no sucede nada (salvo una pelea aburrida).

Finalmente, la probabilidad de que el boxeador i ataque o se cubra varía de acuerdo a sus niveles de daño y cansancio, por lo que el boxeador i debería de estar cambiando la postura de acuerdo a la posición inmediata anterior del boxeador j.

La siguiente tabla presenta la forma en que se comportan los boxeadores, así como sus niveles de daño y cansancio:



Ahora decida el lector la mejor forma de jugar… nos vemos en la próxima entrega.


No hay comentarios:

Publicar un comentario