Google I/O 2024 — Era de Gemini

Vanessa Marely Aristizabal Angel
5 min readMay 20, 2024

--

La era de Gemini es lo que podemos percibir que sobresale en el Google i/o 2024, evento que se realizó el 14 de mayo del 2024, al igual que como inicio la Keynote del Google i/o, la IA es “la tecnología más importante de nuestro tiempo”; estamos frente a una era que nos permitirá resolver problemas complejos de una forma sencilla.

Tomada de la Keynote de Google i/o

El Google i/o, sobresale por las novedades que nos da a conocer sobre los productos de Google, y como cada año nos trae varias novedades, que podemos aprovechar como usuarios finales. A nivel de desarrollo, impulsar la creación de aplicaciones, en especial en esta era de la IA, abriendo un abanico de posibilidades en su uso y la ampliación de su espectro.

Más allá de las novedades tecnológicas, el I/O es un espacio para el networking, la interacción con líderes de comunidades, desarrolladores y expertos. Es una experiencia enriquecedora que impulsa la colaboración y el intercambio de ideas en el mundo de la tecnología.

Tomada de la Keynote de Google i/o

La era de Gemini promete ser transformadora y de los anuncios mencionados el 14 de mayo, podemos destacar los siguientes:

  • Imagen 3, modelo de conversión de texto a imagen de mayor calidad. Produce imágenes fotorrealistas y realistas, con menos artefactos visuales.
  • Sandbox de IA musical, un conjunto de herramientas profesionales de IA musical que pueden crear nuevas secciones instrumentales desde cero, transferir estilos entre pistas y más.
  • Notebook LM, un modelo de lenguaje multimodal que puede generar texto, código e imágenes.
  • Una nueva función en YouTube que utiliza LLM para hacer que los videos educativos sean más interactivos.
  • DeepMind y Project Astra: DeepMind presentó Project Astra, una nueva iniciativa, que abre un mar de posibilidades a los agentes. La demo que presentaron mostró un Agente que usa un modelo de visión por computadora en tiempo real, que puede detectar fácilmente objetos y ayudarnos en esas búsquedas, como cuando hemos perdido algo.
  • Gemini Advanced, una subscripción premium, que proporciona acceso a los modelos de IA más capaces de Google; redefiniendo como interactuamos con la IA.
  • Gems, permitirá personalizar Gemini de acuerdo a nuestras necesidades, creando expertos personalizados en los temas que necesitemos. Esta funcionalidad será lanzada en un par de meses, para permitirnos crear de forma creativa, diferentes asistentes.
  • Gemini 1.5 Pro, modelo de alto rendimiento que es adecuado para tareas complejas, con una ventana de contexto de 1 millón de tokens. Esto le permite procesar y comprender más información que nunca antes, lo que hace posible abordar problemas complejos que antes eran inimaginables. Se puede probar en AI Studio o Vertex AI.
  • Gemini 1.5 Flash, es un modelo ligero que está diseñado para tareas rápidas. Al igual que Gemini 1.5 Pro, se puede probar en AI Studio o Vertex AI.
  • Circle to Search, será una nueva función en Google Search que te permite buscar información usando el gesto de hacer un círculo en tu pantalla. Puedes usar tu dedo o un lápiz óptico para dibujar un círculo alrededor de la información que deseas buscar, y Google te proporcionará resultados relacionados con lo que seleccionaste.
  • Gemini for Workspace, herramienta que se integra directamente en las aplicaciones de Google Workspace, como Gmail, Docs y Slides. Permitiéndote escribir tus emails o documentos, organizarlos en tareas e integrarlos con muchas más herramientas, para mejorar tu productividad.
  • Gemma, modelo que conduce a la innovación de la IA, construido con la misma investigación y tecnología que Gemini. Gemma es un modelo muy usado desde su lanzamiento, al igual que algunas de sus variantes previamente entrenadas, que entre la nueva llamada PaliGemma. En junio será lanzada Gemma 2, la nueva generación de Gemma, con 27B de modelos de parámetros, tamaño optimizado por Nvidia, que corre en la siguiente generación de GPUs y en un único host de TPU en Vertex AI.
  • PaliGemma, primer modelo abierto de lenguaje de visión. Tiene un rango de captura de imágenes, preguntas y respuestas visuales y tareas de etiquetado de imágenes.
  • Project IDX, es un IDE que facilita la creación de aplicaciones multiplataforma, que ahora está abierto al público.
  • Gemini nano, se ejecuta directamente en el móvil, permite baja latencia y privacidad de datos. Gemini nano garantiza la disponibilidad de los modelos de IA, incluso cuando no hay cobertura de red celular.
  • Firebase Data connect with Google Cloud SQL preview, es una nueva forma de crear aplicaciones seguras y con seguridad, con Firebase. Las querys son generadas en el código del client-side, manteniendo el código sincronizado con la estructura de los datos.
  • Firebase App Hosting, permitiéndonos alojar nuestras apps web de Angular o Next.js, de una forma sencilla.
  • Firebase GenKit, un framework que se permite integrar con la IA, en modo beta para node.js y con soporte a Go próximamente.
Tomada de la Keynote de Google i/o

Estas y muchas otras novedades trajo este gran evento de Google i/o, del cual podemos revivir en las siguientes Keynote y conocer más detalles al respecto.

Avances de la Web en el Google I/O

Sin dejar de lado la Web, los siguientes son algunos de los avances que nos trajo este gran evento del Google i/o:

  • Animaciones y transiciones: esta nueva API permite a los desarrolladores crear animaciones basadas en desplazamiento sin depender de observadores u otras secuencias de comandos pesadas. Las animaciones entre páginas web brindarán una experiencia de usuario fluida.
  • Popover API: permitiéndonos crear un popover nativo, ahorrándonos crear opciones personalizadas como se hacían hasta ahora, para diálogos, modales y tooltips, los cuales podemos construirlos con esta nueva API.
  • Select estilizado, aunque es aún experimental, podremos prontamente personalizar los estilos de los select (dropdown) de nuestras aplicaciones web.
  • Propiedades de CSS — nuevas, para mejorar la presentación de textos, colores, además del container query, para mejorar el responsive de nuestras aplicaciones.

Puedes ampliar la información de la era dorada de la Web, en este video:

Además de ampliar más detalles de Angular, Firebase, Chrome en la página oficial del Google i/o

--

--