
08/10/25, 10:00:18
|
|
Noticias HTCMania
|
|
Fecha de registro: mar 2010
Mensajes: 69,058
|
|
Google lanza Gemini 2.5 Computer Use: IA que navega por webs automáticamente
Google lanza Gemini 2.5 Computer Use: IA que navega por webs automáticamente

Google ha presentado Gemini 2.5 Computer Use, un nuevo modelo de inteligencia artificial diseñado para interactuar de forma autónoma con sitios web. Esta IA es capaz de navegar por páginas, hacer clics, rellenar formularios y desplazarse usando solo instrucciones en lenguaje natural. A diferencia de otros agentes que operan sobre todo el sistema, este modelo se centra en entornos web y móviles, lo que lo hace más eficiente para tareas digitales cotidianas sin necesidad de integraciones complejas. El sistema funciona mediante un bucle iterativo: recibe la petición del usuario junto con una captura de pantalla y su historial de acciones, propone una acción (como pulsar un botón o escribir en un campo), y el navegador virtual ejecuta la tarea. A continuación, se actualiza la pantalla y el ciclo se repite hasta completar la instrucción. Esta dinámica ya se usa internamente en Google para pruebas de interfaz y desarrollo de software. Según la compañía, supera a modelos rivales en pruebas web y móviles, con menor latencia y capacidad para resolver tareas complejas como juegos o incluso CAPTCHAs simples. Aun así, Google enfatiza la seguridad y el control del uso indebido: la IA incorpora límites para evitar acciones arriesgadas, y los desarrolladores disponen de herramientas para restringir comportamientos como eludir CAPTCHAs sin autorización. De momento, el modelo está disponible solo para desarrolladores a través de la Gemini API en Google AI Studio y Vertex AI. Aunque no está abierto al público general, representa un paso firme hacia agentes capaces de asumir tareas digitales repetitivas de forma autónoma, marcando el futuro de la interacción con la web.
fuente
|