Google abre por completo su buscador a la inteligencia artificial
Los últimos doce meses de Google se sienten casi como una década. Espoleada por los avances de OpenAI y Microsoft, la empresa ha lanzado varias herramientas de inteligencia artificial propias, redoblado los esfuerzos para dar a conocer las que ya tenía y, por el camino, ha revisado por completo su estrategia con el que ahora es su modelo preferido, Gemini. Ha habido fallos y aciertos pero sobre todo la sensación de que no hay tiempo que perder. Tras años considerada como la compañía al frente de la revolución de la IA, ahora tiene que competir por la atención y los potenciales usuarios mientras rediseña un negocio que no dependa de mostrar simplemente resultados en las búsquedas.
Google IO, la conferencia de desarrolladores que la compañía celebra cerca de su sede en California, es este año el mejor momento para cambiar y sentar expectativas. Ha decidido utilizarlo. En un discurso inaugural dedicado al cien por cien a la inteligencia artificial, Google ha dejado claro que no hay negocios ni divisiones sagradas en su organigrama.
Su principal producto, el buscador que da nombre a la empresa, comenzó el año pasado a experimentar con resúmenes creados por inteligencia artificial generativa junto a las habituales listas de enlaces (patrocinados y orgánicos). Era una proposición arriesgada porque abre una caja de pandora. Estos resúmenes amenazan con robar tráfico a las webs y disminuyen los ingresos por publicidad.
Ahora esta función dejará de ser un experimento. "Desde hoy, los resúmenes creados con IA están disponibles para todos los usuarios en Estados Unidos y el Reino Unido. Pronto saldrán en más países. Eso quiere decir que desde esta semana, cientos de millones de personas tendrán acceso a resúmenes creados con IA, y esperamos llegar a los mil millones para finales de año", explica Liz Reid, responsable del negocio de la búsqueda dentro de Google.
La nueva función permite hacer búsquedas más complejas, que hasta ahora requerían dividir una preguntas en varias consultas, o planificar un viaje sin tener que bucear en media docena de webs. Si una búsqueda no tiene una única respuesta correcta, Google usará la IA para ofrecer sugerencias y crear una página de resultados organizados que haga más fácil comparar las opciones.
Astra
A medio plazo, el plan es más ambicioso. En una semana en la que OpenAI ha sorprendido con un nuevo modelo de lenguaje con capacidad nativa para entender la voz y hablar, Google ha ofrecido un pequeño anticipo de su próximo proyecto, Astra.
Astra es un asistente digital que aprovecha varios avances en el procesamiento de las señales de vídeo y audio para ofrecer una experiencia más parecida a la de estar interactuando con una persona. Los modelos largos de lenguaje, como Gemini o GPT-4o, ofrecen respuestas que son casi indistinguibles de las que daría un ser humano pero a menudo requieren varios segundos para ofrecerlas.
En un pequeño vídeo, Google mostró la velocidad con la que Astra podría reaccionar a las escenas capturadas por la cámara de un móvil, por ejemplo, encontrando objetos y describiendo su uso. Google también mostró un concepto de gafas inteligentes con acceso a este asistente capaz de ver exactamente lo mismo que ve el usuario y guiarlo en cualquier situación.
Para el presente, Google tiene también algunas novedades. Ha anunciado un nuevo modelo dentro de la familia Gemini, Gemini 1.5 Flash, que es más rápido y eficiente que 1.5 Pro y optimizado para resúmenes, aplicaciones de chat, subtítulos de imágenes y vídeos, extracción de datos de documentos y tablas extensas.
Algunos de estos modelos llegarán también a nuevas herramientas de la compañía. Google Workspaces, por ejemplo, ahora tendrá soporte para Gemini 1.5 Pro, que ahora puede manejar contextos más amplios. Google Photos, la herramienta de gestión de imágenes de la compañía, utilizará también estos modelos para ayudar en la búsqueda y clasificación de imágenes.
Google también lanzará pronto una nueva IA generativa centrada en el vídeo, Veo, que será capaz de crear pequeñas secuencias de aspecto realista a partir de descripciones generales en texto, una respuesta al modelo Sora de OpenAI.
"El modelo responde con precisión a peticiones de términos cinematográficos como timelapse o tomas aéreas de paisajes, proporcionando un nivel sin precedentes de control creativo. Crea imágenes consistentes y coherentes: personas, animales y objetos se mueven de manera realista a través de las tomas", explican Douglas Eck y Eli Collins, responsables del producto.
Para demostrar su capacidad, Google ha trabajado en una selección de vídeos creados por Veo bajo la supervisión del artista Donald Glover.
La empresa también ha anunciado la tercera generación de Imagen, su inteligencia artificial generativa de imágenes. Imagen 3 entiende mejor el lenguaje natural y la intención de las peticiones, además de tener en cuenta pequeños detalles de peticiones largas, lo que hace que domine diversos estilos. Incluye también soporte para añadir textos exactos a las imágenes, una función muy compleja de implementar en este tipo de herramientas.