Un estudio de Arcada Labs revela que los modelos de inteligencia artificial más avanzados pierden hasta un 30% en plataformas como Kalshi y Polymarket, desmintiendo las promesas de ganancias fáciles en redes sociales.
Los mercados de predicción Kalshi y Polymarket han ganado notoriedad pública y atraído la atención de reguladores y políticos. También han capturado la imaginación de usuarios en redes sociales, donde algunos publican afirmaciones sobre hacerse ricos utilizando modelos de inteligencia artificial (IA) y obteniendo grandes sumas de dinero.
Sin embargo, un nuevo estudio publicado en el repositorio arXiv de la Universidad de Cornell sugiere que no es tan sencillo. Investigadores de Arcada Labs, a través de su benchmark Prediction Arena, probaron seis modelos de IA de frontera asignando a cada uno 10.000 dólares para operar en mercados de predicción durante 57 días, monitoreando cómo manejaban la información en tiempo real y la toma de decisiones en plataformas como Kalshi.
“Queríamos la evaluación más realista posible sobre si los modelos podían tomar decisiones en tiempo real”, afirmó Grace Li, cofundadora de Arcada Labs y coautora del estudio. El objetivo era ver cómo la IA podía gestionar “información en tiempo real, tomar decisiones en tiempo real y ser recompensada exactamente según cuán contraria fuera su decisión”.
Los resultados no fueron alentadores: todos los modelos perdieron dinero, entre un 16% y un 30,8% en Kalshi, aunque las pérdidas fueron menores en un período más corto en Polymarket. Li cree que esa diferencia puede deberse a cómo se permitió operar a los sistemas: los modelos podían explorar un universo más amplio de mercados en Polymarket, frente a un conjunto estandarizado en Kalshi.
“En Polymarket, los modelos tienen acceso para operar en cualquier mercado”, explicó, mientras que en Kalshi “comienzan solo con un conjunto de 26, porque tuvimos que listar explícitamente los mercados”. En retrospectiva, añadió, “no nos dimos cuenta de cuánto impacto tendría permitir que los modelos eligieran libremente en qué mercados operar”.
Li señaló que las publicaciones en redes sociales que celebran grandes retornos podrían no estar exagerando su impacto. En Polymarket, dijo, “por ahora el trading con modelos de lenguaje sí está cumpliendo con las expectativas”, y mencionó ejecuciones internas recientes en las que “Opus 4.6 realizó un par de operaciones fenomenales”.
No obstante, aclaró que esos éxitos no son evidencia de esquemas para hacerse rico rápidamente, sino una muestra de lo que modelos cada vez más autónomos podrían ser capaces de hacer pronto. “Imaginamos que los modelos mejorarán de manera constante con el tiempo, superando la línea base humana, hasta que los fondos de cobertura impulsados por IA se vuelvan algo habitual”, afirmó.
Aun así, Li concluyó: “Nos interesa menos cuál es la ganancia económica absoluta de esta capacidad, y más qué significa para la humanidad esta unidad adicional de inteligencia”.
