Śrī Pandit Jawāharlāl Nehru, el que fuera primer ministro de
El estudio de sistemas complejos que no pertenecen al campo tradicional de la ciencia está a la orden del día. El póquer es uno especialmente interesante. A diferencia, por ejemplo, de la bolsa de valores, en la que influyen factores como la política, la guerra o el tiempo atmosférico, los torneos de póquer no están afectados por fenómenos externos. Además, se considera que es uno de los juegos de apuestas dónde la habilidad de los jugadores influye más en el resultado final.
Haciendo buena la primera parte de la frase de Nehru, Clément Sire de
Así, por ejemplo, Sire descubrió que tanto el número máximo de fichas (de casino, dinero) que tiene el jugador con más fichas en cada momento como el número total de líderes en fichas de un torneo, son proporcionales al logaritmo del número inicial de jugadores del torneo. Esto es un resultado típico de modelos que reproducen sistemas en los que hay agentes que compiten, como los de la evolución biológica.
Si dadas unas condiciones iniciales podemos predecir el resultado en términos estadísticos, tenemos el determinismo del que hablaba Nehru. Pero, siempre podemos decir que esos son los grandes números, que cada jugador toma cada una de sus decisiones libremente en cada momento. Pero ¿qué ocurre si las apuestas que va a hacer un jugador concreto son predecibles? Eso es lo que consigue la red neuronal artificial (RNA) que ha creado Víctor Chan del Instituto Politécnico de Macao (China) [2].
Chan usó los patrones de juego de 6 jugadores online de Texas Hold’Em, cada uno de los cuales había jugado más de 100 partidas. Introdujo en
M1 es el modelo para el valor de la apuesta sucesiva, que modela sucesivamente y debe predecir los valores de las apuestas en cada una de las partidas que cada jugador realiza en función de sus pérdidas/ganancias en una serie de partidas inmediatamente precedentes y de su resultado neto en el juego.
M2 es el modelo para la trayectoria temporal de las pérdidas/ganancias acumuladas, que modela y predice la trayectoria temporal de las pérdidas/ganancias acumuladas de un jugador en función de las pérdidas/ganancias en una serie de partidas inmediatamente precedentes.
Increíblemente, este modelo también fue capaz de predecir la trayectoria temporal de las pérdidas/ganancias y, por lo tanto, las pérdidas o ganancias acumuladas, con una precisión similar. La influencia de las habilidades de cada jugador, sus estrategias y personalidad está prácticamente reflejada en el patrón de su trayectoria de pérdidas/ganancias de las partidas anteriores.
En resumen, a partir de una muestra de partidas iniciales, el comportamiento de cada jugador era casi completamente predecible matemáticamente de la misma manera en 6 personas. Me imagino a algún jugador profesional o al jefe de sala de un casino leyendo esto y corriendo a buscar aplicaciones prácticas; sin embargo, más trascendentemente, ¿qué significa este resultado para el libre albedrío?
Referencias:
[1]
Sire, C. (2007). Universal statistical properties of poker tournaments Journal of Statistical Mechanics: Theory and Experiment, 2007 (08) DOI: 10.1088/1742-5468/2007/08/P08013
No hay comentarios:
Publicar un comentario