Actualizado el 26/11/2024

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Noticias
  4. >
  5. Google presenta sus novedades en materia de IA

Google presenta sus novedades en materia de IA

Escrito por Guillem Alsina el 28/05/2024 a las 14:25:39
403

Google mantiene el pulso en su particular guerra con OpenAI por el predominio en el sector de la IA, y pese a la creciente popularidad indiscutida de ChatGPT, continúa dando pasos para situar en mejor posición a su LLM (modelo de lenguaje grande, por sus siglas en inglés) Gemini, para el cual presenta novedades y una interesante integración.


Tras haber lanzado varias actualizaciones de Gemini desde diciembre y la familia de modelos ligeros Gemma, abiertos y pensados para su ejecución en local, Google anunciaba hace unos días, y en el marco de su conferencia I/O 2024, el nuevo modelo Gemini 1.5 Flash, implementando nuevas características para desarrolladores y añadiendo dos nuevos modelos de Gemma.


Flash es el modelo más pequeño de Gemini, y está optimizado para tareas más ligeras o de alta frecuencia, para las cuáles la velocidad de respuesta del modelo es más importante que su potencia. Para la versión Pro de Gemini, Google ha mejorado su rendimiento en ámbitos como el de la traducción, la programación, o el razonamiento entre otros.


Ambos cuentan con una ventana de contexto de un millón de tokens y permiten entrelazar texto, imágenes, audio y video como entradas, algo que se conoce cómo multimodalidad, y que OpenAI también ha introducido en su nuevo modelo GPT-4o.


Para acceder a 1.5 Pro con una ventana de contexto de dos millones de tokens, los interesados deberán apuntarse a una lista de espera en Google AI Studio o en Vertex AI para clientes de Google Cloud. Tanto el modelo Flash como la actualización de Gemini 1.5 Pro ya se encuentran disponibles en preview, y se lanzarán definitivamente este próximo mes de junio.


Para Gemma, los modelos ligeros y abiertos, las novedades consisten en primer lugar en el lanzamiento de PaliGemma, modelo de lenguaje y visión optimizado para la subtitulación de imágenes, preguntas y respuestas visuales y otras tareas de etiquetado de imágenes. PaliGemma se une a las variantes lanzadas previamente (CodeGemma y RecurrentGemma).


Gemma 2 es la próxima generación de Gemma, que se lanzará formalmente en junio, y que tiene como meta ser algo más grande y más fácil de usar.


Así, este nuevo modelo, de 27 TB, supera -según afirman desde Google- a algunos modelos que son más del doble de su tamaño, y funcionará de manera eficiente en GPUs o un solo host TPU en Vertex AI.


Gemini integrado en el buscador


De la introducción de inteligencia artificial generativa para mejorar las búsquedas, ya hace tiempo que se habla e, incluso, se dice que OpenAI va a lanzar su propio buscador en algún momento u otro. Google parece que quiere tomarle la delantera a los chicos de Sam Altman, por lo que ha presentado AI Overviews, una funcionalidad que ha estado probando con algunos usuarios avanzados en Search Labs, y que ya se ha desplegado en Estados Unidos y empezará pronto a estar disponible en el resto del mundo.


AI Overviews utiliza IA generativa (concretamente, el modelo Gemini) para responder a preguntas concretas de los internautas, aunque ello implica que, en algunos casos, estos tal vez no acabarán entrando en el resultado de las búsquedas. Es especialmente eficaz cuando se busca la respuesta a una pregunta concreta, y también se utilizará para crear resúmenes de las páginas de resultados.


La misma funcionalidad permite refinar las búsquedas y desglosar los resultados para que sean más “digeribles” por parte de los usuarios, y generar resúmenes de las páginas que constan en los resultados.


Los internautas estadounidenses serán los primeros en disfrutar de esta nueva funcionalidad en las búsquedas relacionadas con ideas, empezando con gastronomía y recetas, y extendiéndose a películas, música, libros, hoteles, y compras entre otras.