Google lanzó esta semana un aluvión de novedades de hardware, desde los smartphones Pixel 9 hasta nuevos auriculares inalámbricos. Detrás de todos estos aparatos brillantes está el asistente de inteligencia artificial Gemini de Google. El chatbot se lanzó a principios de este año y ahora es el asistente predeterminado en la serie Pixel 9 y ya está disponible en millones de teléfonos Android en todo el mundo. Pero hay una nueva forma de hablar con este chatbot que ahora se está desplegando: Gemini Live.
¿Qué es Gemini Live?
Se trata de la respuesta de Google a GPT-4o de OpenAI, una forma de hablar con el asistente de forma natural, muy parecida a una conversación de voz normal entre dos humanos (o al menos ese es el objetivo). Está disponible en inglés para los suscriptores de Gemini Advanced (20$ al mes), y puedes acceder a ella pulsando el pequeño botón Live en la parte inferior derecha de la aplicación Gemini. En las próximas semanas llegará a la aplicación para iOS y a más idiomas.
Sissie Hsiao, vicepresidente de experiencias Gemini de Google, explica a WIRED que este chatbot no es solo un Google Assistant pimpeado. A lo largo de los años de creación de Assistant, hay dos cosas que los usuarios nos han pedido en repetidas ocasiones”, señala Hsiao, “la primera es que quieren un asistente más fluido y natural: quieren poder hablar con él de forma natural sin tener que cambiar su forma de hablar. La segunda es más capaz; que les ayude a resolver los problemas de su vida, no solamente tareas sencillas.”
¿Cómo se usa Gemini Live?
Inicia Gemini y verás una pantalla en blanco con una luz etérea brillando en la parte inferior. Puedes comenzar a hablar con el asistente y mantener una conversación incluso si tu teléfono está bloqueado y la pantalla está apagada, y también es accesible a través de los nuevos audífonos inalámbricos Pixel Buds Pro 2 de Google para que puedas hablar con manos libres mientras tu teléfono está en tu bolso. Hay 10 voces que puedes elegir de diferentes tonos, acentos y estilos. Cuando termines la sesión, verás una transcripción de toda la conversación, y es algo a lo que puedes acceder en cualquier momento en la app Gemini.
A diferencia de los antiguos asistentes de voz, Gemini Live te permite interrumpir la conversación sin interrumpir con ello toda la experiencia. Y la idea es conectarlo con otras aplicaciones a través de extensiones, aunque muchas de ellas aún no están disponibles. Por ejemplo, podrás pedirle a Gemini Live que busque una invitación a una fiesta en tu Gmail y te dé la hora y el lugar en vez de tener que buscarlo tú mismo. O buscar una receta y pedirle que añada los ingredientes a una lista de la compra en Google Keep. Google declara que estas extensiones para sus aplicaciones como Keep, Tareas, Utilidades, Calendario y YouTube Music se lanzarán en las próximas semanas.
A finales de año, Google incorporará a Gemini Live Project Astra, la tecnología de visión por computadora que anunció en su conferencia de desarrolladores de mayo. Esto te permitirá utilizar la aplicación de cámara de tu teléfono y, en tiempo real, preguntar a Gemini sobre los objetos que estás mirando en el mundo. Imagina que pasas por delante de un cartel de un concierto y le pides que guarde las fechas en tu calendario y te recuerde que tienes que comprar las entradas.
Más información: https://es.wired.com/articulos/que-es-gemini-live-y-como-lo-uso