Así funciona Nova Act, la apuesta de Amazon para liderar la nueva generación de inteligencias artificiales
A diferencia de ChatGPT o Gemini, Nova Act puede interactuar con sitios web y realizar acciones como completar formularios o concretar compras
10/04/2025 – 11:13hs
Amazon no quiere quedarse atrás en la carrera por la inteligencia artificial y presentó Nova Act, un nuevo agente de IA que promete cambiar la forma en que interactuamos con la web.
El anuncio llegó a fines de marzo, y aunque la herramienta todavía está en una etapa preliminar —lo que llaman research preview—, Amazon ya liberó una versión de prueba para que desarrolladores puedan experimentar con sus capacidades.
A diferencia de modelos como ChatGPT o Gemini, Nova Act está pensado como un asistente que podría, en el futuro, reemplazar muchas de las tareas manuales que hacemos en internet: no solo responde preguntas, también es capaz de navegar por sitios web, llenar formularios, hacer clic en menús desplegables y completar una compra por vos. El objetivo es que el usuario gane tiempo y eficiencia.
Amazon también planea integrarlo con Alexa+, su asistente virtual, para llevar la experiencia del usuario a otro nivel. Basado en los modelos Nova presentados en 2024, este nuevo sistema puede ejecutar órdenes con gran precisión y, además, aprender y mejorar con el uso, gracias a técnicas como el fine-tuning y el aprendizaje por refuerzo.
¿Qué lo diferencia de ChatGPT o Gemini?
Si bien OpenAI, Google y Anthropic ya venían probando agentes con capacidad de navegación, Amazon apuesta a destacarse por la precisión de su IA. Según pruebas internas, Nova Act logró un 94% de precisión en tareas como identificar texto dentro de imágenes web, superando a Claude 3.7 Sonnet (90%) y al CUA de OpenAI 8%).
Uno de los mayores desafíos para estas tecnologías es interactuar con interfaces web complejas y cambiantes: menús emergentes, banners de cookies, ventanas flotantes… Nova Act busca destacarse precisamente allí, ofreciendo una mayor estabilidad en la ejecución de tareas frente a sus competidores.
Otra diferencia clave: mientras que ChatGPT o Gemini dependen de la forma en que están construidos los sitios web para integrarse, Nova Act puede funcionar de manera autónoma. Esto le da ventaja a la hora de operar sin necesidad de desarrollos o permisos adicionales.
IA en el comercio: el escenario se calienta
Google, por su parte, acaba de lanzar Agentspace, una plataforma que reúne a sus agentes de IA con el motor de búsqueda de Gemini y datos empresariales. La idea es mejorar la productividad con una sola indicación, aprovechando texto, imágenes, audio y video de forma integrada.
«Los agentes de IA ya no son una promesa a futuro; están transformando la experiencia del cliente hoy mismo, desde la búsqueda hasta la compra y la postventa», dijo Carrie Tharp, vicepresidenta de Soluciones e Industrias Globales en Google Cloud. Según explicó, estas soluciones están pensadas tanto para pymes como para grandes compañías, ofreciendo desde recomendaciones de productos hasta atención al cliente personalizada.
¿Qué falta por probar?
Aunque Nova Act ya mostró buenos resultados en tareas visuales, todavía no fue evaluado oficialmente en entornos más exigentes como WebVoyager, una prueba que mide cómo se comporta al mover el mouse o controlar el teclado. Esto podría plantear interrogantes sobre su rendimiento en escenarios más complejos.
Aun así, con este lanzamiento, Amazon se mete de lleno en la competencia de los agentes inteligentes. Nova Act podría marcar un antes y un después en la forma en que usamos internet, abriendo paso a una nueva era donde la navegación se vuelve casi invisible, y mucho más eficiente.