Model Update2026-05-30Google AI Blog

Google presenta Gemini Omni y Gemini 3.5 en 9 demostraciones

En Google I/O 2026, el gigante tecnológico presentó sus últimos modelos de IA —Gemini Omni y Gemini 3.5— a través de una serie de nueve videos de demostración que impresionaron a los asistentes y espectadores en línea. Las demostraciones mostraron las capacidades multimodales avanzadas de los modelos, que les permiten comprender y generar contenido a través de texto, imágenes, audio y video de manera fluida. Gemini Omni está diseñado para ser un modelo universal que puede procesar cualquier tipo de entrada y producir resultados coherentes y conscientes del contexto. En una demostración, el modelo analizó una transmisión de video en vivo, respondió preguntas sobre la escena y, simultáneamente, generó un resumen escrito y una narración de audio. Gemini 3.5, por otro lado, se centra en un razonamiento y una eficiencia mejorados, superando a su predecesor en puntos de referencia para la resolución de problemas complejos y tareas creativas. Las demostraciones destacaron aplicaciones prácticas: desde la traducción en tiempo real del lenguaje hablado con contexto visual hasta la generación de informes detallados a partir de material de video en bruto. Google también mostró cómo los modelos podrían ayudar en flujos de trabajo creativos, como editar imágenes basándose en instrucciones en lenguaje natural o componer música a partir de un mensaje de texto. Estos anuncios posicionan a Google a la vanguardia de la tecnología de IA multimodal, compitiendo directamente con las ofertas de OpenAI y Anthropic. La compañía enfatizó que ambos modelos están disponibles a través de la plataforma Vertex AI de Google Cloud, lo que permite a los desarrolladores integrarlos en sus propias aplicaciones. Los analistas de la industria señalaron que el salto en el rendimiento multimodal podría revolucionar campos como la educación, el entretenimiento y la accesibilidad. Por ejemplo, un estudiante podría subir un video de una conferencia y recibir una transcripción resumida con imágenes clave, mientras que un creador de contenido podría generar una presentación multimedia completa a partir de una sola idea. Google también adelantó futuras actualizaciones, incluyendo funciones mejoradas de colaboración en tiempo real y una integración más estrecha con su ecosistema de productos. A medida que la IA se vuelve más versátil, Gemini Omni y Gemini

Noticias relacionadas