Póquer; máquinas ponen al límite la destreza humana
El codiseñador del programa Libratus charló con Excélsior sobre su búsqueda para lograr que la Inteligencia Artificial sea capaz de razonar acerca de la incertidumbre
CIUDAD DE MÉXICO.
Que alguien pierda en el ajedrez ante una máquina resulta ya un lugar común. Después de todo, los avances de la Inteligencia Artificial han sido con base en fórmulas lógicas y matemáticas y el ajedrez es sobre todo eso, lógico y calculable.
Claro que un gran maestro ajedrecista tendrá siempre la posibilidad de vencer a la máquina. Por ejemplo, Garry Kasparov, que el 10 de febrero de 1996 perdió un juego frente a una computadora –Deep Blue–, capaz de evaluar 200 millones de jugadas en un segundo, ganó luego tres y empató dos, en una serie de seis partidas con la máquina.
Pero fue la primera vez que la Inteligencia Artificial ganaba una partida a ese nivel y se le consideró un momento histórico.
El Go, un juego de estrategia popular sobre todo en Oriente Medio, y que algunos consideran como superior al ajedrez, es también lógico y con posibilidades de cálculo matemático. Por eso, cuando el 19 de marzo de 2016 una computadora especialmente diseñada venció en cuatro juegos de cinco a Lee Sedol, uno de los tres mejores jugadores de Go del mundo, mereció la atención internacional.
Para hacerlo, entre otras cosas, la máquina fue equipada con un programa basado en el llamado “aprendizaje profundo”, que les permite identificar “patrones” de entre masas de datos y aplicarlos, con poca intervención humana. Se le usa, entre otras cosas, para reconocimiento facial.
De hecho, ahí está la base de la idea de que las Inteligencias Artificiales puedan desarrollarse a partir de aprendizaje y comenzar a actuar independientemente. Y el ajedrez, el backgammon y el Go son un buen punto de partida para tecnologías que comienzan a llegar, de hecho, a campos como la medicina y la investigación científica.
Pero otra vez, son juegos de lógica. Y por eso, que una computadora –perdón, Inteligencia Artificial– sea capaz de vencer a humanos en el póquer resulta más, mucho más complicado.
La razón es simple. El póquer es un juego de cartas en el que la lógica tiene un lugar, pero entre otras cosas requiere también de la capacidad de engañar.
Nuestra meta es hacer Inteligencia Artificial capaz de razonar acerca de la incertidumbre... el mundo real está lleno de información incompleta e incertidumbre, esto ese esencial para hacer Inteligencias Artificiales que puedan actuar en el mundo real”, dijo a Excélsior Noam Brown, el aspirante a doctor en Ciencias de Cómputo que codiseñó el programa Libratus.
Para la cadena británica BBC, el punto es simple y más cortés: “el póquer es más difícil porque es un juego con información imperfecta”. Los participantes nunca tienen una visión completa del estado del juego y por tanto la computadora -por decirlo así- tiene que tomar en cuenta como juega o ha jugado su oponente”.
En otras palabras, “con el ajedrez y Go, cada jugador puede ver todo el tablero, pero con el póquer, los jugadores no llegan a ver las manos del otro. Además, la Inteligencia Artificial tiene que bluffear e interpretar correctamente información engañosa para ganar”. O sea, actuar como ser humano.
En lo que se presenta como un momento histórico, un programa bajo el nombre de Libratus derrotó a cuatro famosos jugadores de póquer, en la variedad no-limit-heads-up Texas hold’em durante un torneo que duró 20 días en un casino de Pittsburgh.
Básicamente es un juego de siete cartas, donde cada jugador recibe dos cubiertas y combina con cinco descubiertas que son comunes a todos los participantes. De acuerdo con la descripción de GVC Holdings PLC, una empresa internacional de juegos de azar, es un juego agresivo, que “requiere el dominio de todos los clásicos elementos del póquer: matemáticas, sicología, lectura de manos y corazón”.
Más aún, es un juego “mano a mano”, o sea entre dos. En el caso de referencia, fue entre la computadora y un rival humano. O cuatro simultáneamente.
Para Tuomas Sandholm, profesor de Ciencias de Cómputo en la Universidad de Carnegie Mellon y uno de los creadores de Libratus, se trata de un momento histórico, al menos para la Inteligencia Artificial.
Es en cierta forma la última frontera de todos los juegos”, dijo. “El ajedrez, el Go, Jeopardy han sido conquistados, pero éste seguía elusivo”, añadió.
El secreto está en un algoritmo, dijo Sandholm al periódico británico The Guardian.
El programa correspondiente fue literalmente creado para jugar el no-limit-heads-up Texas hold’em, pero de acuerdo con sus creadores va mucho más allá: “Los algoritmos pueden tomar información y salir con una estrategia en un rango de escenarios, incluso negociaciones, finanzas, tratamientos médicos y ciberseguridad”.
De acuerdo con Georgios Yannakakis, de la Universidad de Malta, en comentarios a la revista New Scientist, es de enorme importancia. “Esto es como la realidad: el mundo real es un juego de información imperfecta, y al solventar el póquer nos acercamos un paso más a la inteligencia artificial general”.
De acuerdo con los señalamientos de Brown a este diario, “elegimos el póquer porque nos parece que representa mejor el problema de la información oculta”.
Claro que no fue tan simple como parece. De acuerdo con los reportes de prensa, el Centro de Super Cómputo de
Pittsburg agregaba a diario computaciones para mejorar las estrategias de la IA.
Y todas las mañanas Brown, el estudiante de doctorado que diseñó Libratus, pasaba hasta dos horas en lo que un aficionado llamaría “reactualizando” la computadora con la nueva información incorporada.
Brown se especializa en “teoría del juego” y en especial, trabaja sobre el aprendizaje reforzado, particularmente en hallar estrategias de equilibrio en juegos de información masiva imperfecta.
Para Brown, el punto es fundamental. “La incapacidad para manejar información oculta es una gran carencia de las Ies actuales”, precisó.
Tanto las sesiones nocturnas como matutinas eran, de hecho, “sesiones de estudio”, como las que tenían sus adversarios humanos, que también noche a noche comparaban notas para afinar sus propios planes de juego.
La competencia se llamó “Los Cerebros contra la Inteligencia Artificial” y puso a cuatro jugadores considerados entre los mejores de su tipo (Dong Kim, Jason Les, Jimmy Chou y Daniel McAulay) contra Libratus.
Cada uno de ellos pasó hasta 11 horas diarias frente a pantallas de computadora en un casino de Pittsburgh.
Hace dos años otra Inteligencia Artificial, Claudicus, perdió en su torneo contra otros cuatro jugadores. Pero esta vez la historia fue diferente.
Libratus acumuló 1.7 millones de fichas. Los perdedores, sin embargo, se consolaron con 200 mil dólares distribuidos de acuerdo con su actuación.
Nosotros no le dijimos a Libratus como jugar póquer. Le dimos las reglas y le dijimos ‘aprende’”, dijo Brown, citado por el diario británico The Guardian.
De acuerdo con The NewScientist, “esto significa que Libratus podría ser aplicado en cualquier situación que requiera una respuesta basada en información imperfecta”.
Hay aplicaciones en seguridad cibernética, negociaciones, escenarios militares, subastas y más”, dijo Sandholm.
EL EDITOR RECOMIENDA








