Actualizado el 18/02/2025

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Noticias
  4. >
  5. OpenAI anuncia Operator su primer agente de IA

OpenAI anuncia Operator su primer agente de IA

Escrito por Guillem Alsina el 04/02/2025 a las 18:09:49
282

Afirman los analistas que este 2025 va a ser el año en el que despegarán los agentes de IA, que consisten en programas que permiten realizar tareas completas entendiendo el contexto de lo que les rodea gracias a los modelos de lenguaje grandes.


Lo que la mayoría de nosotros hemos podido ir probando hasta ahora como usuarios de la inteligencia artificial son los chatbots al estilo ChatGPT, Gemini o Claude, pero estos solamente generan texto e imágenes, adoleciendo de una gran carencia que los haría realmente útiles: no disponen de las herramientas para interactuar con los programas del ordenador ni con los elementos que vemos en el escritorio para completar tareas.


Por ejemplo, si generamos un texto para publicar, tendremos que copiarlo manualmente desde ChatGPT (la interfaz de usuario del chatbot ya dispone de un icono que permite realizar dicha tarea) y, después, pegarlo en el documento o CMS (por ejemplo, Word y Wordpress para cada uno de los casos) que queramos para continuar con su edición.


Si, en cambio, disponemos de un agente, y este tiene acceso a mover el cursor del ratón en pantalla, y de un teclado virtual, el mismo agente será capaz, entendiendo su contexto y, por lo tanto, discriminando con qué ventanas tiene que interactuar y cómo hacerlo, de copiar por su propia cuenta el contenido del texto generado, para pegarlo en el procesador de textos (Word, LibreOffice o el que sea) o el CMS (Wordpress o el que sea) y, después, realizar las demás acciones que consideremos oportunas.


OpenAI ha puesto a disposición de los usuarios estadounidenses que tengan cuenta Pro (la de 200 dólares mensuales) una versión previa todavía no definitiva de Operator, su primer agente, el cual es capaz de realizar tareas completas mediante la manipulación del escritorio del ordenador como si fuera él mismo quien lo estuviera usando, gracias a su capacidad de poder controlar el puntero del ratón como si lo estuviera moviendo físicamente, y de disponer de un teclado virtual que actúa cómo si estuviera tecleando en el teclado físico.


Así, por ejemplo, podemos darle una simple orden a Operator para que nos haga todas las reservas correspondientes a una escapada de fin de semana a Roma, y él lo que haría sería reservar los vuelos de ida y vuelta, y el hotel. También podemos ser más específicos, señalándole que no queremos ir en avión, y que el hotel debe ser próximo al Coliseo.


Otras tareas que puede llevar a cabo son, por ejemplo, crear las diapositivas de una presentación, o gestionar el calendario/agenda del usuario, convirtiéndose así en una suerte de asistente personal.


Para trabajar, Operator abre una ventana propia del navegador, que utiliza para desempeñar sus funciones, y también va dando detalles de qué es lo que hace. Se basa en GPT-4o con capacidades de visión (eso es, tiene la capacidad de entender el contenido de una imagen) para poder interactuar con las aplicaciones.


Está sujeto a limitaciones del número de tareas que puede llevar a cabo durante el día e, incluso aunque puede desempeñar varias tareas simultáneamente, OpenAI también ha introducido limitaciones en ello.


Una vez Operator ya esté maduro, llegará a los planes de pago Plus, Team y Enterprise, y también se extenderá fuera de los Estados Unidos. Respecto a esto último, es probable que los usuarios británicos, suizos y, en general, todos los que se encuentren fuera de la Unión Europea, lo reciban antes, y en territorio de la UE tarde más en llegar.