Novedades de Gemini: la IA sigue enfocándose a la fotografía

55

Está de moda hablar de la IA, pero, en realidad, todos sabemos que es mucho más que un trend. Es nuestro presente, pero ante todo es nuestro futuro. Nos guste más o menos, la inteligencia artificial ha llegado para quedarse. Me da pena ver que la mayoría de la gente le tiene miedo a la IA. No debería ser así. Siempre pongo el ejemplo de los cambios que llegaron durante la Revolución Industrial o incluso, más atrás, que aquellas primeras “máquinas” para hacer fuego. Dejamos de frotar piedras para avanzar y la inteligencia artificial es algo así… pero a lo bruto. Gemini, ChatGPT, GROK… diferentes nombres para distintos modelos, pero todos ellos con la IA en el centro de todo.

Precisamente hoy quiero hablar de las novedades de Gemini que acaba de presentar Google. Gemini es uno de los modelos de inteligencia artificial que están teniendo un mayor desarrollo y que se postula como uno de los líderes de la IA. En este caso, estas dos novedades se centran en fotografía, pero también en la creación de la figura de “expertos”, una novedad que me parece muy interesante y de la que te quiero hablar a continuación.

Imagen 3: la IA aplicada a la fotografía cada vez tiene menos límites (y ya se pueden crear imágenes de personas)

Uno de los temas más controvertidos que han surgido en torno a la IA es el tema de la fotografía. Como todo, usado en las manos incorrectas puede llegar a hacer mucho daño. No quiero entrar a poner ejemplos, pero seguro que a ti también se te ocurren varios casos en los que la generación de imágenes por IA puede ser bastante polémica. De hecho, para evitar esto están empezando a surgir regulaciones, como la Ley de IA europea.

Las imágenes generativas también pueden ser muy útiles y precisamente estos modelos están aprendiendo a hacerlo cada vez mejor. Es una de las capacidad que se incluyen en estas novedades de Gemini, que despliega ahora Imagen 3, el último modelo de generación de imágenes en alta calidad y con más posibilidades.

Imagen 3 estará incluido en las aplicaciones de Gemini (también en la versión gratuita) y en todos los idiomas. Ya se está desplegando, si todavía no lo ves disponible solo tendrás que esperar unos días.

Estos son los ejemplos que nos ha dejado Google. Con la premisa “Genera una imagen de un coche futurista conduciendo por una carretera de montaña rodeado de naturaleza” o “Crea una imagen de un vestido de fiesta hecho con servilletas de papel en una sala de exposición elegante”, nos encontramos estas imágenes perfectas, llamativas y, en el caso del vestido, bastante realistas.

imagenes generadas con imagen 3 gemini

Las ventajas de esta nueva generación es que podemos obtener lo que queremos (o incluso algo mejor de lo que tenemos en mente) a partir de instrucciones breves, además de poder contar con diferentes estilos: fotos realistas, texturas de pintura, animaciones, etc. Para insertar las marcas de agua, utiliza la herramienta SynthID y para proteger nuestros derechos cuenta con sistemas de protección basados en los principios de diseño de Google. Entre estos principios de diseño, se incluye el hecho de que el usuario en todo momento tiene control sobre el proceso creativo.

Además, una de las grandes novedades de Gemini y más concretamente de Imagen 3 es que se incluye por primera vez la generación de imágenes de personas. Tendrá sus limitaciones, como quizá también te pase a ti, la generación de imágenes de personas sí que me da algo de miedo. En este caso, Google apunta que no se podrán crear escenas sangrientas, violentas o sexuales, además, tampoco se podrán crear imágenes de menores o de personas reconocibles.

De momento, esto solo estará disponible en inglés para los usuarios de Gemini Advanced, Business y Enterprise, aunque se espera que poco a poco vaya aumentando su disponibilidad para que podamos disfrutarlo más usuarios, tanto los de las versiones de pago como los de otros países.

Gems: llegan los “expertos” que te ofrecen ayuda personalizada

Otra de las novedades de Gemini es la llegada de la figura de los Gems. Esto puede ser un poco más complicado de entender, pero te lo quiero explicar de un modo sencillo para que lo puedas comprender fácil. Los Gems son el resultado de una nueva función que permite personalizar Gemini para hacerlo experto en cualquier tema.

No todos usamos la IA para lo mismo, de hecho, para temas profesionales es donde hasta ahora ofrece más posibilidades. Pero no son las mismas las peticiones las que va a hacer un programador, por ejemplo, que un electricista, un escritor o un matemático. Por lo tanto, los Gems son versiones personalizadas de Gemini que se pueden afinar y especializarse en el tema o los objetivos del usuario.

Asígnale un nombre a tu “experto”, dale instrucciones y comienza a chatear con él sobre el tema específico con el que necesitas ayuda. Este Gem podrá recordar instrucciones detalladas, además de ofrecerte la mejor ayuda personalizada y convertirse en un miembro más en tu equipo de expertos.

Por ahora, hay varios Gems ya creados y listos para utilizar: tutor personal (para obtener información compleja), orientador profesional (para proponerte cómo avanzar en tu carrera y mejorar tus competencias), revisión de escritura (para mejorar tu nivel de redacción a todos los niveles), exploración de ideas (para inspirarte con ideas varias) y asistente de programación (para escribir código de programación).

Al igual que la generación de imágenes de personas, de momento esta opción solo estará disponible para los usuarios de Gemini Advanced, Business y Enterprise, pero ten en cuenta que solo en algunos países e idiomas (el español no está incluido en esta primera etapa), aunque la lista se espera que se vaya ampliando progresivamente y que llegue a más territorios y sobre todo a más idiomas para que todos los usuarios podamos disfrutar de estas novedades de Gemini.

¿Merece la pena pagar a día de hoy por Gemini Advanced?

Depende. Si vas a usar Gemini con un propósito profesional, sí que puede ser interesante. Para algo personal o usos puntuales, con la versión gratuita te basta. Esta versión gratuita incluye una ventana de contexto con 32.000 tokens, acceso al modelo 1.5 Flash, la posibilidad de hacer borradoras o de usar varias apps de Google a la vez, entre otras opciones.

Por su parte, la versión Gemini Advanced tiene un precio de 21,99 euros al mes, con un mes de prueba gratuito para que puedas valorar si es una buena opción para ti e incluye ventajas como acceso prioritario a las nuevas funciones de Gemini, 2 TB de almacenamiento en Google One, la opción de ejecutar código Phyton directamente en él, una ventana de contexto con 1 millón de tokens y mucho más.

La ventaja de Gemini Advanced, además de que te quita muchas limitaciones, es que puedes acceder a novedades de Gemini como las que te hemos hablado hoy y probarlas desde el primer momento. Eso sí, echo en falta que el español sea uno de los primeros idiomas incluidos en estas novedades, pero es algo relativamente habitual y la mayoría de nosotros nos defendemos relativamente bien con el inglés, por lo que te deberíamos tener mayor problema.

FUENTE: Gizcomputer.com