El nuevo Gemini demuestra una ambición de Google: que hablemos sin parar con nuestro móvil

El nuevo Gemini demuestra una ambición de Google: que hablemos sin parar con nuestro móvil

Google ha presentado este martes una renovada familia de teléfonos Pixel. Después de varios rumores y filtraciones, los Pixel 9, Pixel 9 Pro y Pixel 9 Pro XL ahora son oficiales. La compañía del buscador, no obstante, no se ha olvidado de la inteligencia artificial (IA), y ha dado a conocer varias novedades relacionadas a Gemini.

El mencionado asistente de AI abraza un sistema multimodal llamado Gemini Live que añade una serie de mejoras interesantes. Una de las más interesantes es un modo de voz que, en cierto modo, nos recuerda a lo último de ChatGPT. La promesa es que podremos conversar de manera natural con Gemini e incluso interrumpirle.

Gemini, el asistente de AI de Google, tiene un nuevo modo de voz

Antes de este lanzamiento ya podíamos hablarle a Gemini, pero el nuevo modelo quiere destacar por elementos como la fluidez (con baja latencia) y la multimodalidad. En primer lugar, el asistente promete entender el contexto y tiene cierta información sobre nosotros que puede ayudarle a hacer mejor las tareas que le pidamos.

Por ejemplo, podremos pedirle a Gemini en lenguaje natural que cree un nuevo recordatorio y añada un evento a nuestro calendario. Aquí hay dos ventajas evidentes. Si bien podíamos hacer esto antes con Google Assistant, teníamos que limitarnos a utilizar un lenguaje muy estructurado, comandos para que el móvil nos entendiera.

Captura De Pantalla 2024 08 13 A Las 14 30 13

Esta limitación está desapareciendo con el nuevo modelo. Por otra parte, la versión de Gemini que podíamos utilizar hasta este momento no nos permitía realizar acciones sobre el sistema. Era básicamente un espejo de lo que podíamos hacer en la versión web. Ahora, no obstante, asume el rol de un verdadero asistente en nuestro móvil.

Captura De Pantalla 2024 08 13 A Las 14 46 45

Gracias a su integración con Android, Gemini promete hacer mucho más que simplemente leer la pantalla: permite interactuar con varias de las aplicaciones que utilizamos a diario. Por ejemplo, tendremos la capacidad de arrastrar y soltar imágenes generadas por Gemini directamente en aplicaciones como Gmail y Mensajes.

A nivel de multimodalidad, Gemini ahora puede entender una imagen y, producto de esta capacidad, puede conversar con nosotros sobre ella. En este caso podremos tomar una fotografía de una cita médica y pedirle al asistente que creen un evento en relación a la información que ve en la fotografía. Parece algo realmente práctico y útil.

Gemi Live también deja atrás las voces con ciertas características robóticas y da paso a 10 nueve voces que suenan mucho más naturales. Cabe señalar que esta novedad estará disponible, al menos de momento, para los usuarios que pagan por Gemini Advanced en móviles compatibles.

Imágenes | Google

En Xataka | Prompt Poet es la última herramienta que ha comprado Google. La ingeniería de ‘prompts’ sube enteros


La noticia

El nuevo Gemini demuestra una ambición de Google: que hablemos sin parar con nuestro móvil

fue publicada originalmente en

Xataka

por
Javier Marquez

.