CONECTATE CON NOSOTROS

Ciencia y Tecnología

Así es Lumiere, la nueva IA de Google enfocada en vídeos

Avatar

Publicado

en

El nuevo modelo de inteligencia artificial de la gran G puede animar imágenes y editar vídeos a partir de textos.

La tecnología de inteligencia artificial generativa llegó a Google con el anuncio de Lumiere, la última innovación del buscador en el campo de vídeo. Otro campo que la gran G está dispuesto a inundar con IA, siguiendo su premisa más fuerte de este año.

Esta avanzada IA tiene la capacidad de transformar texto y fotos en vídeos dinámicos, según lo explicó Google en su blog.

El gigante tecnológico dio a conocer la herramienta a través de un video explicando las capacidades de Lumiere. Con solo unas pocas indicaciones escritas o una imagen estática como punto de referencia, esta IA puede crear vídeos completos, llenos de movimiento o incluso recrear vídeos en estilos específicos.

La función principal de Lumiere es su capacidad para generar vídeos a partir de texto. Utilizando un modelo de difusión de texto a vídeo, esta IA es capaz de interpretar instrucciones escritas y traducirlas en vídeos completamente nuevos a partir de simples descripciones.

Otra función destacada de Lumiere es su capacidad para generar vídeos basados en estilos específicos. Con solo una imagen de referencia, esta IA puede crear vídeos que imiten ciertos estilos visuales.

Lumiere también cuenta con capacidades de inpainting de vídeo, lo que le permite rellenar áreas faltantes en un vídeo de manera realista. Esta función es útil para corregir errores en el metraje o eliminar objetos no deseados de una manera que parezca natural y coherente con el resto del vídeo.

Conversión de imagen a video, pintura de video y generación estilizada

Para lograr esto, Google explica el proceso de desarrollo de esta herramienta. “Al implementar un muestreo descendente y ascendente tanto espacial como (lo más importante) temporal y aprovechar un modelo de difusión de texto a imagen previamente entrenado, nuestro modelo aprende a generar directamente un video de baja resolución y velocidad de cuadros completa procesándolo en múltiples escalas espacio-temporales”, dice Google en su blog.

Según se destaca en el blog oficial de la empresa del buscador más utilizado del mundo, Lumiere “facilita una amplia gama de tareas de creación de contenido y aplicaciones de edición de video, incluida la conversión de imagen a video, pintura de video y generación estilizada”. Hasta el momento, este es un proyecto de investigación de Google por lo que no se ha detallado si su uso estará disponible para el públLas capacidades de Lumiere gracias a la IA generativa

▪️ Crear vídeos a partir de texto: escribes la descripción, y Lumiere lo hace realidad

▪️ Crear vídeos a partir de imágenes: lo que significa que puede convertir imágenes estáticas en vídeos con movimiento.

▪️ Generar vídeos estilizados en base a imágenes: la IA puede usar una imagen como referencia de estilo al crear los vídeos que el usuario le pida.

▪️ Editar vídeos: puede modificar partes de un vídeo existente. Por ejemplo, en un vídeo de una mujer corriendo es posible pedirle “que la mujer esté hecha de flores”, y la IA lo hará realidad.

▪️ Hacer “cinemagraphs”: o dicho de otra forma, animar partes específicas de imágenes

Continuar Leyendo

Ciencia y Tecnología

Google lanza dos modelos de lenguaje de IA diferentes a Gemini

Avatar

Publicado

en

Por

Los nuevos sistemas Gemma están enfocados en desarrollos simples y para desarrolladores poco especializados.

Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos. (Google)
Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos.

Google ha dado a conocer dos nuevos modelos de lenguaje diseñados para potenciar el desarrollo de aplicaciones y sistemas de inteligencia artificial, especialmente en Gemini que es el foco de la compañía, después de tomar el lugar de Bard.

Estos modelos, conocidos como Gemma 2B y 7B, representan un avance en la accesibilidad y versatilidad de las herramientas de IA para los desarrolladores, con el objetivo de enfocarse en servicios más simples, como el caso de chatbots sencillos o los resúmenes.

Cómo son los dos modelos de lenguaje de Google

Las dos versiones de Gemma surgen como una alternativa más ligera y flexible a su predecesor, el modelo Gemini, que se destaca por su tamaño y potencia y que compite directamente con otros modelos de IA de gran envergadura como el ChatGPT de OpenAI. Mientras que estos dos lanzamientos son una opción más accesible y adecuada para tareas más simples.

Esta diferenciación es crucial, ya que abre las puertas a que un mayor número de desarrolladores y empresas puedan entrar en el campo de la inteligencia artificial, sin necesidad de recurrir a recursos tan costosos y complejos como los exigidos por Gemini.

Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos. (Imagen Ilustrativa Infobae)Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos.

El enfoque de Gemma radica en su eficiencia y facilidad de uso. A pesar de su menor tamaño, Google asegura que los modelos Gemma “superan significativamente a modelos más grandes en indicadores clave” y son capaces de ejecutarse directamente en computadoras portátiles o de escritorio.

Esta característica los convierte en una opción interesante para una amplia variedad de aplicaciones, desde proyectos de investigación hasta implementaciones comerciales en diversos sectores, que no necesitan de tecnologías tan avanzas y complejas.

Google confirmó que para este modelo se han anunciado con NVIDIA para optimizar Gemma en las tarjetas gráficas de la compañía, en funciones como la gestión de datos en la nube y la funciones de RTX AI en los computadores.

Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos. (Imagen Ilustrativa Infobae)Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos.

Otra diferencia de este lanzamiento, respecto a Gemini, es la liberación del modelo en código abierto, lo que marca un cambio en la estrategia de Google.

Mientras que Gemini se ha mantenido como un modelo cerrado, accesible solo a través de API o la plataforma Google’s Vertex AI, Gemma adopta un enfoque más inclusivo al estar disponible en plataformas como Kaggle, Hugging Face, Nvidia’s NeMo y Google’s Vertex AI.

Esto permitirá que un mayor número de personas puedan experimentar con él y con las capacidades de IA de Google, dando mayor variedad de herramientas a los desarrolladores.

“A medida que continuamos ampliando la familia de modelos Gemma, esperamos introducir nuevas variantes para diversas aplicaciones. Estén atentos a los eventos y oportunidades en las próximas semanas para conectarse, aprender y desarrollar con Gemma”, publicó Google en su blog.

Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos. (Imagen Ilustrativa Infobae)Gemma es un modelo de lenguaje de IA enfocado en desarrollos sencillos.

Los desafíos del lanzamiento de Gemma

La responsabilidad y la ética son parte de los retos de este anuncio. Con el fin de abordar estas preocupaciones, Google ha implementado un conjunto de herramientas conocido como “Responsible AI Toolkit”, diseñadas para ayudar a los desarrolladores a establecer pautas éticas al implementar los modelos Gemma en sus proyectos.

Estas herramientas incluyen la capacidad de crear listas de palabras prohibidas, herramientas de depuración de modelos y orientación sobre mejores prácticas en la construcción de modelos de lenguaje.

Otro reto de la compañía es expandir su acceso más allá del inglés. Esta posibilidad abrirá nuevas oportunidades para el uso de Gemma en una variedad de contextos y aplicaciones, permitiendo diferenciarse de otros modelos similares de la industria.

El lanzamiento de Gemma se produce en un momento en el que otras empresas de IA también están explorando la creación de modelos más ligeros y accesibles. Meta, por ejemplo, lanzó Llama 2 7B el año pasado, mientras que Google ha ampliado su gama de modelos Gemini con versiones como Gemini Nano, Gemini Pro y Gemini Ultra.

Continuar Leyendo

Ciencia y Tecnología

WhatsApp impide hacer capturas de pantalla a las fotos de perfil de otras personas

Avatar

Publicado

en

Por

La aplicación de mensajería refuerza la privacidad con una nueva función.

WhatsApp acaba de recibir una nueva actualización, dirigida a mejorar la privacidad de los usuarios. Aunque la compañía no ha anunciado (todavía) la llegada de esta nueva versión, hemos podido comprobar cómo la versión beta de la aplicación de mensajería instantánea de Meta más reciente impide realizar capturas de pantalla de las fotos de perfil de otros usuarios de la plataforma de mensajería.

Ya no se podrán hacer capturas de fotos de perfil en WhatsApp Hasta ahora, WhatsApp no tenía ningún tipo de restricción a la hora de hacer capturas de pantalla, ni de los chats, ni de ningún otro lugar de la aplicación.

Eso ha cambiado con la llegada de WhatsApp Beta 2.24.4.25, la última versión distribuida a través de Google Play Store. Y es que, según hemos podido comprobar, ya no se pueden hacer capturas de pantalla de las fotos de perfil de otros miembros.

Al intentar capturar la pantalla en la página de imágenes de perfil de un usuario, aparece un aviso en la parte inferior de la pantalla que indica que “no se puede capturar la pantalla debido a las restricciones de la app”.

En otros casos, aunque sí se puede realizar la captura, en la imagen no aparece la foto de perfil del usuario, sino un fondo completamente negro.

Una práctica habitual

Hacer capturas de pantalla para compartirlas con otras personas es, desafortunadamente, una práctica demasiado habitual, que puede poner en riesgo la privacidad de aquellos usuarios que no quieren que su fotografía de perfil sea compartida.

Hace no mucho, WhatsApp exploró la opción de poder configurar dos fotos de perfil diferentes para así evitar este tipo de problemas, pero sin duda el bloqueo de capturas de pantalla será un método mucho más efectivo.

De momento, esta función no se encuentra disponible para todos los usuarios. Solamente aquellos que hayan descargado e instalado la última versión beta de la app se encontrarán con la restricción que impide hacer capturas de las fotos de perfil. Pero es cuestión de tiempo para que está función se convierta en una protección estándar para todos los usuarios de la aplicación de mensajería instantánea.

Actualizarse para no ser el próximo SMS

WhatsApp viene reformulando permanentemente sus medidas de protección, tanto para garantizar la privacidad de los usuarios como para evitar convertirse en el próximo SMS: un buzón lleno de publicidad y mensajes maliciosos que a nadie le interesan.

Es por eso que, entre otras medidas, agilizó el método de bloqueo de contactos, para que ya no sea necesario entrar al contacto para bloquearlo.

Continuar Leyendo

Ciencia y Tecnología

Demandan a Google, Meta, y TikTok por «dañar la salud mental de los niños»

Avatar

Publicado

en

Por

La Ciudad de Nueva York cree que plataformas como YouTube, TikTok o Instagram están detrás del deterioro de la salud mental de los jóvenes

La ciudad de Nueva York presentó una demanda contra Meta, Google, TikTok y Snap por, supuestamente, ser las principales responsables de una «crisis sanitaria de salud mental entre los ciudadanos más jóvenes».

Las autoridades de la ciudad que nunca duerme aseguran que plataformas como Instagram, Facebook, YouTube, TikTok o Snapchat cuentan con algoritmos dañinos y otras técnicas que manipulan a niños y adolescentes.

La ciudad norteamericana destina más de 100 millones de dólares anuales en programas de salud mental. Esta problemática ocupa un lugar cada vez más importante en las prioridades de la cartera de Salud de Nueva York.

En la demanda, publicada por el Ayuntamiento de Nueva York, se especifica que la ciudad decidió unirse a cientos de distritos escolares de todo el país en su decisión de presentar litigios contra las grandes tecnológicas, con el objetivo de hacerles cambiar el comportamiento de sus plataformas, y que hagan frente a los costes que conllevan las medidas tomadas por los organismos en su lucha contra los problemas de salud mental.

En ese sentido, el alcalde de Nueva York, Eric Adams , afirma que la ciudad destina más de 100 millones de dólares anualmente a servicios y programas de salud mental orientados a los más jóvenes.

Algoritmos dañinos 

La demanda hace referencia, principalmente, a los «algoritmos dañinos» incluidos en plataformas como Instagram, Facebook, YouTube, TikTok o Snapchat, así como a los mecanismos similares a los de los juegos de azar o la «manipulación a través de la reciprocidad» La ciudad afirma que se ha visto una correlación entre el aumento del uso de redes sociales y el deterioro de la salud mental de los jóvenes.

Y quieren que las compañías paguen por ello. Por su parte, las compañías detrás de las plataformas que la demanda pone como objetivo niegan las acusaciones, y tanto Google como Meta afirman que siempre han trabado junto a expertos en seguridad juvenil y se han proporcionado herramientas de control parental desde los inicios.

Sea como fuere, desde el Ayuntamiento seguirán adelante con la demanda, y solicitarán a las compañías que cubran los costes de los servicios y programas, así como a introducir medidas con las que evitar la manipulación de los usuarios más jóvenes.

Eric Adams: el demandante menos pensado 

El alcalde de Nueva York, Eric Adams, es miembro del ala derecha del Partido Demócrata, aunque sus primeros pasos en la política los dio como miembro del Partido Republicano.

Durante su campaña para alcalde, se definió como «pro-empresarial» y prometió hacer de Nueva York «el centro de las criptodivisas y otras industrias innovadoras de alto crecimiento» y decidió cobrar sus primeros sueldos en bitcoins.

Por eso sorprende que el golpe a las corporaciones tecnológicas haya venido de este ex policía de 63 años que prometió abrazar a las industrias innovadoras y ahora las está demandando.

Continuar Leyendo