lunes

TEORIA DE JUEGOS



Los juegos estudiados por la teoría de juegos están bien definidos por objetos matemáticos. Un juego consiste en un conjunto de jugadores, un conjunto de movimientos (o estrategias) disponible para esos jugadores y una especificación de recompensas para cada combinación de estrategias. Hay dos formas comunes de representar a los juegos.

[]
Forma normal de un juego

Un juego en forma normal
El jugador 2 elige izquierdaEl jugador 2 elige derecha
El jugador 1 elige arriba4, 3-1, -1
El jugador 1 elige abajo0, 03, 4



La forma normal (o forma estratégica) de un juego es una matriz de pagos, que muestra los jugadores, las estrategias, y las recompensas (ver el ejemplo a la derecha). Hay dos tipos de jugadores; uno elige la fila y otro la columna. Cada jugador tiene dos estrategias, que están especificadas por el número de filas y el número de columnas. Las recompensas se especifican en el interior. El primer número es la recompensa recibida por el jugador de las filas (el Jugador 1 en nuestro ejemplo); el segundo es la recompensa del jugador de las columnas (el Jugador 2 en nuestro ejemplo). Si el jugador 1 elige arriba y el jugador 2 elige izquierda entonces sus recompensas son 4 y 3, respectivamente.
Cuando un juego se presenta en forma normal, se presupone que todos los jugadores actúan simultáneamente o, al menos, sin saber la elección que toma el otro. Si los jugadores tienen alguna información acerca de las elecciones de otros jugadores el juego se presenta habitualmente en la forma extensiva.
También existe una forma normal reducida. Ésta combina estrategias asociadas con el mismo pago.

[]
Forma extensiva de un juego


Un juego en forma extensiva.
La representación de juegos en forma extensiva modela juegos con algún orden que se debe considerar. Los juegos se presentan como árboles (como se muestra a la derecha). Cada vértice o nodo representa un punto donde el jugador toma decisiones. El jugador se especifica por un número situado junto al vértice. Las líneas que parten del vértice representan acciones posibles para el jugador. Las recompensas se especifican en las hojas del árbol.
En el juego que se muestra en el ejemplo hay dos jugadores. El jugador 1 mueve primero y elige F o U. El jugador 2 ve el movimiento del jugador 1 y elige A o R. Si el jugador 1 elige U y entonces el jugador 2 elige A, entonces el jugador 1 obtiene 8 y el jugador 2 obtiene 2.
Los juegos en forma extensiva pueden modelar también juegos de movimientos simultáneos. En esos casos se dibuja una línea punteada o un círculo alrededor de dos vértices diferentes para representarlos como parte del mismo conjunto de información (por ejemplo, cuando los jugadores no saben en qué punto se encuentran).
La forma normal da al matemático una notación sencilla para el estudio de los problemas de equilibrio, porque desestima la cuestión de cómo las estrategias son calculadas o, en otras palabras, de cómo el juego es jugado en realidad. La notación conveniente para tratar estas cuestiones, más relevantes para la teoría combinatoria de juegos, es la forma extensiva del juego.

[]
Tipos de juegos y ejemplos

La teoría clasifica los juegos en muchas categorías que determinan qué métodos particulares se pueden aplicar para resolverlos (y, de hecho, también cómo se define "resolución" en una categoría particular). Las categorías comunes incluyen:

[]
Juegos simétricos y asimétricos

Artículo principal: Juego simétrico
Un juego asimétrico
EF
E1, 20, 0
F0, 01, 2
Un juego simétrico es un juego en el que las recompensas por jugar una estrategia en particular dependen sólo de las estrategias que empleen los otros jugadores y no de quién las juegue. Si las identidades de los jugadores pueden cambiarse sin que cambien las recompensas de las estrategias, entonces el juego es simétrico. Muchos de los juegos 2×2 más estudiados son simétricos. Las representaciones estándar del juego de la gallina, el dilema del prisionero y la caza del ciervo son juegos simétricos.2
Los juegos asimétricos más estudiados son los juegos donde no hay conjuntos de estrategias idénticas para ambos jugadores. Por ejemplo, el juego del ultimátum y el juego del dictador tienen diferentes estrategias para cada jugador; no obstante, puede haber juegos asimétricos con estrategias idénticas para cada jugador. Por ejemplo, el juego mostrado a la derecha es asimétrico a pesar de tener conjuntos de estrategias idénticos para ambos jugadores.

[]
Juegos de suma cero y de suma no cero

Artículo principal: Juego de suma cero
Un juego de suma cero
ABC
130, -30-10, 1020, -20
210, -1020, -20-20, 20
En los juegos de suma cero el beneficio total para todos los jugadores del juego, en cada combinación de estrategias, siempre suma cero (en otras palabras, un jugador se beneficia solamente a expensas de otros). El go, el ajedrez, el póker y el juego del oso son ejemplos de juegos de suma cero, porque se gana exactamente la cantidad que pierde el oponente. Como curiosidad, el fútbol dejó hace unos años de ser de suma cero, pues las victorias reportaban 2 puntos y el empate 1 (considérese que ambos equipos parten inicialmente con 1 punto), mientras que en la actualidad las victorias reportan 3 puntos y el empate 1.
La mayoría de los ejemplos reales en negocios y política, al igual que el dilema del prisionero, son juegos de suma no cero, porque algunos desenlaces tienen resultados netos mayores o menores que cero. Es decir, la ganancia de un jugador no necesariamente se corresponde con la pérdida de otro. Por ejemplo, un contrato de negocios involucra idealmente un desenlace de suma positiva, donde cada oponente termina en una posición mejor que la que tendría si no se hubiera dado la negociación.
Se puede analizar más fácilmente un juego de suma cero, y cualquier juego se puede transformar en un juego de suma cero añadiendo un jugador "ficticio" adicional ("el tablero" o "la banca"), cuyas pérdidas compensen las ganancias netas de los jugadores.
La matriz de pagos de un juego es una forma conveniente de representación. Por ejemplo, un juego de suma cero de dos jugadores con la matriz que se muestra a la derecha.

[editar]
Criterios Maximin y Minimax

Los criterios maximin y minimax establecen que cada jugador debe minimizar su pérdida máxima:
  • Criterio Maximin: el jugador A, elige que su pago mínimo posible sea el mayor.
  • Criterio Minimax: el jugador B elige que el pago máximo a A sea el menor posible.

[]
Equilibrio de Nash.

Los equilibrios de las estrategias dominantes están muy bien cuando aparecen en los juegos, pero desafortunadamente, eso no ocurre con frecuencia. Un par de estrategias es un equilibrio de Nash si la elección del jugador A es óptima, dada elección de B, y la de B es óptima, dada la de A.
El equilibrio de Nash puede interpretarse como un par de expectativas sobre la elección de cada persona tal que, cuando la otra revela su elección, ninguna de las dos quiere cambiar de conducta.

[]
Juegos cooperativos

Artículo principal: juego cooperativo
Un juego cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está muy relacionada con la estabilidad.
Dos jugadores negocian qué tanto quieren invertir en un contrato. La teoría de la negociación axiomática nos muestra cuánta inversión es conveniente para nosotros. Por ejemplo, la solución de Nash para la negociación demanda que la inversión sea justa y eficiente.
De cualquier forma, podríamos no estar interesados en la justicia y exigir más. De hecho, existe un juego no-cooperativo creado por Ariel Rubinstein consistente en alternar ofertas, que apoya la solución de Nash considerándola la mejor, mediante el llamado equilibrio de Nash.

[]
Simultáneos y secuenciales

Los juegos simultáneos son juegos en los que los jugadores mueven simultáneamente o en los que éstos desconocen los movimientos anteriores de otros jugadores. Los juegos secuenciales (o dinámicos) son juegos en los que los jugadores posteriores tienen algún conocimiento de las acciones previas. Este conocimiento no necesariamente tiene que ser perfecto; sólo debe consistir en algo de información. Por ejemplo, un jugador1 puede conocer que un jugador2 no realizó una acción determinada, pero no saber cuál de las otras acciones disponibles eligió.
La diferencia entre juegos simultáneos y secuenciales se recoge en las representaciones discutidas previamente. La forma normal se usa para representar juegos simultáneos, y la extensiva para representar juegos secuenciales.

[]
Juegos de información perfecta


Un juego de información imperfecta (las líneas punteadas representan la ignorancia de la parte del jugador 2).
Un subconjunto importante de los juegos secuenciales es el conjunto de los juegos de información perfecta. Un juego es de información perfecta si todos los jugadores conocen los movimientos que han efectuado previamente todos los otros jugadores; así que sólo los juegos secuenciales pueden ser juegos de información perfecta, pues en los juegos simultáneos no todos los jugadores (a menudo ninguno) conocen las acciones del resto. La mayoría de los juegos estudiados en la teoría de juegos son juegos de información imperfecta, aunque algunos juegos interesantes son de información perfecta, incluyendo el juego del ultimátum y el juego del ciempiés. También muchos juegos populares son de información perfecta, incluyendo el ajedrez y el go.
La información perfecta se confunde a menudo con la información completa, que es un concepto similar. La información completa requiere que cada jugador conozca las estrategias y recompensas del resto pero no necesariamente las acciones.
En los juegos de información completa cada jugador tiene la misma "información relevante al juego" que los demás jugadores. El ajedrez y eldilema del prisionero ejemplifican juegos de información completa. Los juegos de información completa ocurren raramente en el mundo real, y los teóricos de los juegos, usualmente los ven sólo como aproximaciones al juego realmente jugado.
John Conway desarrolló una notación para algunos juegos de información completa y definió varias operaciones en esos juegos, originalmente para estudiar los finales de go, aunque buena parte de este análisis se enfocó en nim. Esto devino en la teoría de juegos combinatoria. Descubrió que existe una subclase de esos juegos que pueden ser usados como números, como describió en su libroOn Numbers and Games, llegando a la clase muy general de los números surreales.

[]
Juegos de longitud infinita (SuperJuegos)

Por razones obvias, los juegos estudiados por los economistas y los juegos del mundo real finalizan generalmente tras un número finito de movimientos. Los juegos matemáticos puros no tienen estas restricciones y la teoría de conjuntos estudia juegos de infinitos movimientos, donde el ganador no se conoce hasta que todos los movimientos se conozcan.
El interés en dicha situación no suele ser decidir cuál es la mejor manera de jugar a un juego, sino simplemente qué jugador tiene una estrategia ganadora (Se puede probar, usando el axioma de elección, que hay juegos —incluso de información perfecta, y donde las únicas recompensas son "perder" y "ganar"— para los que ningún jugador tiene una estrategia ganadora.) La existencia de tales estrategias tiene consecuencias importantes en la teoría descriptiva de conjuntos

Matriz de resultados de un juego

La matriz de resultados de un juego representa el resultado del juego en una matriz. Supongamos que dos personas, A y B, están jugando un sencillo juego. El juego consiste en lo siguiente: la persona A tiene la posibilidad de elegir “arriba” o “abajo”, mientras que B puede elegir “izquierda” o “derecha”. Los resultados del juego se representan en la matriz de resultados:

Izquierda
Derecha
Arriba
(50 , 100)
(0 , 50)
Abajo
(100 , 50)
(50 , 0)

Estrategia dominante

Una estrategia dominante es aquella elección que realiza el jugador independientemente de lo que haga el otro. En el juego representado en la matriz de arriba, la estrategia dominante para A es elegir “abajo”, mientras que la estrategia dominante para B es elegir “izquierda”. Estas estrategias dominantes dan como resultado el equilibrio de estrategias dominantes del juego. Si cada jugador tiene una estrategia dominante se puede predecir el resultado del juego.

Equilibrio de Nash

El equilibrio de Nash fue formulado por John Nash, que es un matemático norteamericano, en 1951. Un par de estrategias es un equilibrio de Nash si la elección de A es óptima dada la de B y la de B es óptima, dada la de A. El equilibrio de Nash se diferencia del equilibrio de las estrategias dominantes en que, en el equilibrio de las estrategias dominantes, se exige que la estrategia de A sea óptima en el caso de todas las elecciones óptimas de B, y viceversa. El equilibrio de Nash es menos restrictivo que el equilibrio de estrategias óptimas.
Un juego puede tener más de un equilibrio de Nash. Existen juegos en los no existe un equilibrio de Nash.

Dilema del prisionero

Considera la siguiente historia. Dos sospechosos de un crimen son puestos en celdas separadas. Si ambos confiesan, cada uno será sentenciado a tres años de prisión. Si sólo uno confiesa, el que confiese será liberado y usado como testigo contra el otro, quien recibirá una pena de diez años. Si ninguno confiesa, ambos serán condenados por un cargo menor y tendrán que cumplir una pena de sólo un año de prisión. Este juego puede ser representado por una matriz 2x2:

Sospechoso B confiesa
Sospechoso B no confiesa
Sospechoso A confiesa
(3 , 3)
(0 , 10)
Sospechoso A no confiesa
(10 , 0)
(1 , 1)
Veamos cuál es la estrategia óptima para cada sospechoso. Si B confiesa, A preferirá confesar, ya que si confiesa obtendrá una pena de 3 años, y si no confiesa obtendrá una pena de 10 años. Si B no confiesa, A preferirá confesar, ya que de este modo será liberado, y si no confesara obtendrá una pena de un año. Entonces, A va a confesar, independientemente de lo que haga B. Análogamente, B también va a confesar independientemente de lo que haga A. Es decir, ambos sospechosos van a confesar y obtener entonces una pena de tres años de prisión cada uno. Este es el equilibrio del juego, que es ineficiente en el sentido de Pareto, ya que se puede reducir la condena de ambos si ninguno confesara.
Este es el ejemplo mas famoso de las situaciones en la que los equilibrios competitivos pueden llevar a resultados ineficientes. El dilema del prisionero ilustra la situación que se presenta en los cárteles. En un cártel, las empresas coalicionan (hacen un acuerdo) para reducir su producción y así poder aumentar el precio. Sin embargo, cada empresa tiene incentivos para producir mas de lo que fijaba el acuerdo y de este modo obtener mayores beneficios. Sin embargo, si cada una de las firmas hace lo mismo, el precio va a disminuir, lo que resultará en menores beneficios para cada una de las firmas. La misma estructura de interacciones caracteriza el problema de la provisión de bienes públicos (problema del free rider), y del pago voluntario de impuestos.

Juegos de suma constante

Juegos en los que para cada combinación de estrategias, la suma de los pagos (o utilidades) a cada jugador es la misma. Todas las situaciones de intercambio que no permiten la creación o destrucción de recursos son juegos de suma constante.

Árbol de juegos

El árbol de juegos es una representación de un juego que describe la estructura temporal de un juego en forma extensiva. EL primer movimiento del juego se identifica con un nodo distintivo que se llama la raíz del juego. Una jugada consiste en una cadena conectada de ramas que comienza en la raíz del árbol y termina, si el juego es finito, en el nodo terminal. Los nodos representan los posibles movimientos en el juego. Las ramas que parten de los nodos representan las elecciones o acciones disponibles en cada movimiento. A cada nodo distinto del nodo terminal se le asigna el nombre de un jugador de modo que se sabe quién hace la elección en cada movimiento. Cada nodo terminal informa sobre las consecuencias para cada jugador si el juego termina en ese nodo.

Juego repetido

En un juego repetido un grupo fijo de jugadores juega un juego dado repetidamente, observando el resultado de todas las jugadas pasadas antes que comience la siguiente jugada. La posibilidad de observar las acciones y los resultados pasados antes de que comience la siguiente jugada permite que los jugadores penen o premien las acciones pasadas, de modo que surgen estrategias que no surgirían en los juegos simples no repetidos. Por ejemplo, repitiendo el juego del dilema del prisionero un número suficiente de veces da como resultado un equilibrio en el cual ambos prisioneros nunca confiesan

No hay comentarios:

Publicar un comentario