CONECTATE CON NOSOTROS

Ciencia y Tecnología

Google reveló las capacidades de Gemini, su modelo multimodal de Inteligencia Artificial más avanzado hasta la fecha

Avatar

Publicado

en

La compañía tecnológica hizo el anuncio más importante en cuanto a sus desarrollos de IA desde que ChatGPT sacudió a la industria de la tecnología, con un lanzamiento que la deja más cerca del objetivo de hacer realidad una Inteligencia Artificial General. Los detalles de su funcionamiento

Gemini representa el paso más importante que ha dado Google para exponer los avances su trabajo en el campo de la IA.

Google reveló los detalles y características de funcionamiento de su apuesta más grande en materia de Inteligencia Artificial (IA) hasta la fecha: Gemini, un «nuevo modelo multimodal» que podría desplazar del centro de la escena al ya famoso ChatGPT de OpenAI, que tras su lanzamiento a finales del 2022 desató una carrera entre las grandes compañías tecnológicas por dominar el terreno de los modelos grandes de lenguaje (LLM, por sus siglas en inglés).

La demostración de lo que es capaz de hacer Gemini, que tuvo lugar este miércoles a partir de una serie de videos difundidos por Google, representa el paso más importante que ha dado la compañía para exponer los avances de un trabajo de desarrollo que lleva años y se intensificó durante los últimos meses. En mayo pasado, durante su conferencia para desarrolladores llamada I/O, la empresa había anunciado que en poco tiempo lanzarían este nuevo modelo.

La ventaja central que le permite a Gemini sobresalir entre otros modelos de la competencia es su multimodalidad, es decir, su capacidad para comprender no solo texto sino además otro tipo de formatos como imágenes, video, audio e incluso código de programación, interactuando y procesando toda la información en simultáneo. Otras empresas, como OpenAI, han desarrollado modelos diferenciados como DALL-E –para la generación de imágenes– y Whisper –reconocimiento de voz–.

Esta característica del nuevo modelo de Google es la conjunción de todo el tiempo y los recursos que la empresa ha dedicado a la investigación en el campo de la IA, en donde hicieron aportes fundamentales para que se configurara el escenario actual.

Sundar Pichai, CEO de Google, dijo que este lanzamiento representa una nueva era para la IA dentro de Google. «Una de las cosas más poderosas de este momento es que puedes trabajar en una tecnología subyacente, mejorarla y que inmediatamente fluya a través de nuestros productos», destacó.

Cómo es Gemini, la nueva IA de Google

En uno de los videos que fueron publicados por la empresa y compartido por Pichai, se puede ver a Gemini en funcionamiento. «Dime lo que ves», es la petición mediante voz que da inicio a la interacción con el modelo, que comienza a identificar y describir lo que colocan frente a una cámara con la que está conectado.

Al ver los trazoz de algunas líneas sobre un papel, Gemini solo describe detalles superficiales, pero a medida que el dibujo va tomando forma el modelo identifica particularidades de lo que primero describe como «un pájaro» y, luego, como «un pato». La IA sigue todo el proceso en tiempo real y no solo interpreta lo que muestra la imagen para hacer una mera descripción, sino que además agrega datos adicionales y continúa respondiendo al diálogo con la persona con la que interactúa.

Gemini también es capaz de hacer traducciones a otros idiomas, como español, francés y japonés; y reproducir un audio con la pronunciación correcta de cada palabra, al igual que el traductor de Google. No obstante, para interactuar de momento solo se puede hacer en inglés.

El video también da cuenta de la complejidad que alcanza la interacción entre el humano y el modelo. «Basándote en lo que vez, propón una idea de juego, y usa emojis», se le pide a Gemini, que al identificar el mapamundi que se le está mostrando sugiere jugar a adivinar el país, para lo cual genera pistas que representa con emojis.

En otro de los momentos del video, la IA es capaz de reconocer el dibujo final en uno de los clásicos juegos de unir puntos para completar la imagen, que al principio parece ser el de un gato. El modelo no solo interpreta que se trata del conocido juego, sino que además es capaz de completar el boceto correctamente.

Tres versiones y llegada al motor de búsqueda

Mientras que los modelos más básicos de Gemini admiten entrada y salida de texto, los más potentes pueden funcionar con imágenes, video y audio. «Y se volverá aún más general», afirmó Demis Hassabis, director ejecutivo de Google DeepMind, la división de la compañía dedicada a investigaciones sobre IA y Machine Learning.

Hassabis anticipó que con el tiempo se sumarán otras vías de interacción «como la acción y el tacto» para mejorar aún más el modelo. Gemini tendrá más sentidos, se volverá más consciente y será más preciso, lo que le permitirá también superar los sesgos y alucinaciones que generan problemas en sus resultados, agregó el encargado de DeepMind.

Imagen ilustrativa de las versiones de Gemini y su complejidad. (Google)

Gemini cuenta con tres versiones diferentesGemini Nano, que es más acotada y podrá funcionar de manera nativa y offline en dispositivos Android; Gemini Pro, que potenciará los servicios de IA de Google, incluido su chatbot Bard; y Gemini Ultra, el LLM más poderoso de los tres que se lanzará el próximo año y está pensado para la ejecución de tareas en centros de datos y usos corporativos.

Hassabis y Pichai comentaron que Google no pretende avanzar lo más rápido posible en el desarrollo de estos modelos, sino más bien hacerlo de forma responsable. Su propósito final, como ya han anticipado, es conseguir una Inteligencia Artificial General (AGI), cuyas capacidades superarán a las de los humanos y le permitirán mejorarse a sí misma.

«A medida que nos acerquemos a AGI, las cosas serán diferentes», afirmó Hassabis, y sumó: «Es una especie de tecnología activa, por lo que creo que debemos abordarla con cautela. Con cautela, pero con optimismo».

 

Continuar Leyendo

Argentina

Google fusiona su equipo de hardware con el equipo de Android

Avatar

Publicado

en

Por

Google quiere cambiar por completo la experiencia de sus dispositivos y para ello ha combinado el equipo Android con el de hardware, creando un solo departamento de desarrollo

Google ha tomado una decisión estratégica significativa al fusionar su equipo de hardware con el equipo de Android. Esta reorganización tiene como objetivo optimizar la colaboración y la eficiencia entre estos dos grupos clave dentro de la empresa.

No es la primera vez que Google decide combinar diferentes equipos, aunque normalmente estas fusiones se han dado en equipos con una finalidad similar como ocurrió con los equipos de Brain de Google Research y DeepMind.

La convergencia entre hardware y software es cada vez más crucial en la industria tecnológica. Google, como uno de los gigantes del sector, busca aprovechar al máximo esta sinergia.

Al unir el equipo de hardware, responsable de dispositivos como los teléfonos Pixel y los Chromebooks, con el equipo de Android, que desarrolla el sistema operativo móvil más utilizado en el mundo, Google busca crear una estructura cuya integración y agilidad beneficie a la empresa.

Google apuesta por una convergencia entre los equipos de Android y hardware

Ha sido Sundar Pichai, CEO de Google, el que ha anunciado esta nueva organización en la empresa. Junto a estos cambios ha nacido un nuevo equipo que recibe el nombre de “Plataforms and Devices” que supervisará todos los productos Google Pixel, Chrome, ChromeOS, Fotos y Android.

Además, estará dirigido por Rick Osterloh que dejará de ser el vicepresidente ejecutivo para asumir este nuevo cargo.

Esto también implica que Hiroshi Lockheimer, director de Android, Chrome y ChromeOS, abandonará su cargo. Eso sí, no dejará la empresa y ahora se centrará en otros proyectos tanto dentro de Google como en Alphabet.

El movimiento no es para nada arriesgado, de hecho, es lógico que Google haya decidido dar el paso y combinar los esfuerzos de ambos equipos en el desarrollo tanto de productos como de un software capaz de dar vida a estos dispositivos.

Las declaraciones que ha ofrecido Rick Osterloh a The Verge permiten conocer las intenciones de Google. El actual director del nuevo equipo “Plataforms and Devices” indica que consolidar equipos permitirá que Google pueda innovar de forma total y sin limitaciones.

Potenciar la IA también está en los planes de la empresa y es uno de los motivos de esta fusión. Hasta la fecha, los equipos destinados a desarrollar el hardware y software trabajaban de forma independiente, siendo necesarias constantes revisiones para asegurar el buen funcionamiento y la integración de ambos aspectos.

Google ha decidido cambiar por completo el enfoque de trabajo. Hasta ahora, la empresa ha trabajado separando Android de la creación de sus propios equipos. Esto se ha debido, en parte, para poder ofrecer un terreno justo en el que competir con el resto de fabricantes de dispositivos Android.

Además, también protegían sus relaciones con empresas como Samsung. Esto ha cambiado en los últimos años gracias al desarrollo de dispositivos de la mano del equipo de hardware, siendo el Google Pixel un responsable de este cambio de mentalidad. Ahora la compañía busca sentar las bases del desarrollo dentro del sector Android y lo hará de la mano de un equipo que camine hacia el mismo objetivo.

Continuar Leyendo

Argentina

WhatsApp se actualiza con una función de lo más útil: llegan los filtros

Avatar

Publicado

en

Por

La app de mensajería cambia por completo la gestión de las conversaciones con los filtros de chats.

WhatsApp estrena una de las características más solicitadas por los usuarios. En el blog oficial de la aplicación de mensajería se puede leer que los filtros de chats aterrizan en WhatsApp. Sí, la novedad que acaba de anunciar WhatsApp permitirá mantener el orden dentro de la interfaz de la aplicación.

A veces, encontrar un mensaje específico puede ser como buscar una aguja en un pajar. Es aquí donde entran en juego los filtros de chat. Estos filtros permiten buscar y acceder a nuestros mensajes de manera más rápida y eficiente.

Cómo funcionan los filtros de chat en WhatsApp

Los filtros de chat se han diseñado pensando en la comodidad del usuario. Estos se encontrarán en la parte superior de la interfaz de WhatsApp que ahora se encuentra vacía debido a la última actualización estable de la aplicación. WhatsApp solo ha integrado tres filtros:

  • Todos: las conversaciones individuales y grupos se agruparán en este filtro.
  • No leídos: si tienes muchos chats y solo deseas ver los que aún no has leído, los filtros permitirán hacerlo. Esto es especialmente útil cuando el usuario está ocupado y se quiere poner al día rápidamente.
  • Grupos: todos los grupos se encontrarán dentro de este filtro. WhatsApp indica que los usuarios llevan solicitando este filtro en concreto desde hace varias actualizaciones. También se encontrarán en este filtro las comunidades de WhatsApp a las que pertenezcas.

Otra de las ventajas clave de los filtros de chat es que ayudan a mantener nuestra privacidad. Al acceder directamente a los chats que interesan, así se evita que otras personas vean los mensajes personales. Esto es especialmente útil cuando se está en lugares públicos o se comparten los dispositivo.

Esto es todo, aunque WhatsApp indica que mejorará esta característica a lo largo de las siguientes semanas. Es más que probable que se integren nuevos filtros o que cambien su disposición, lo mejor de esto es ver cómo la compañía escucha a sus usuarios y añade novedades interesantes.

Los filtros de chats para WhatsApp se han lanzado hoy 16 de abril, pero estarán disponibles a lo largo de las siguientes semanas.

Es probable que sea necesario actualizar el dispositivo para que aparezcan en la interfaz de WhatsApp, así que lo recomendable es mantener siempre la aplicación al día y comprobar regularmente tanto en la Play Store como en la App Store si se ha lanzado una nueva versión.

Continuar Leyendo

Argentina

Telegram ahora permite crear stickers sin salir de la aplicación

Avatar

Publicado

en

Por

El nuevo editor de stickers de Telegram es bastante más completo que el de WhatsApp

Las populares pegatinas con imágenes o animaciones, más conocidas como stickers, se han convertido en un elemento imprescindible a la hora de comunicarse en las apps de mensajería.

En Telegram aterrizaron en 2015, hace ya casi 10 años, volviéndose animados allá por 2019, pero hasta ahora era necesario descargar e instalar stickers en Telegram para poder hacer uso de ellos. Sin embargo, esto acaba de cambiar: a partir de hoy, se podrán crear stickers y packs de stickers sin salir de la app.

A pesar de que Telegram ha servido de inspiración a multitud de funcionalidades que posteriormente han llegado a WhatsApp, en esta ocasión, la plataforma de Meta ha tomado ventaja: desde principios de año, puedes crear stickers directamente desde WhatsApp, sin tener que recurrir a apps de terceros y luego transferirlos.

Eso sí, el nuevo editor de Telegram es bastante más completo que el de WhatsApp.

Así funciona el nuevo editor de stickers de Telegram, ya disponible

Para comenzar a crear stickers, lo primero que se debe hacer es entrar en la aplicación de Telegram y abrir el panel de stickers, localizado en el campo de escritura de cualquier chat, igual que sucede en WhatsApp. Después, pulsar sobre el nuevo botón “+” y se abrirá una galería de imágenes recientes, permitiendo seleccionar la foto que se quiera convertir en sticker.

Entonces, Telegram dará la opción de “Recortar un objeto”, lo que eliminará el fondo de la imagen de forma automática. Si el editor ha borrado una parte de las gafas, de la gorra, de las patitas de una mascota o, simplemente, no ha hecho una eliminación de fondo correcta, siempre se puede “Restaurar” y corregir la eliminación manualmente. Además, los stickers quedarán mucho más profesionales si se presino sobre “Añadir contorno”.

Una vez hecho esto, el siguiente paso será añadir todos los elementos deseados: texto, garabatos, emojis, superponer otros stickers, fotos o GIFs animados, entre otras muchas posibilidades, accesibles desde los pequeños iconos del editor. Cuando esté la creación terminada, se podrá enviar el sticker o crear un pack de stickers para que otros contactos puedan reutilizar las creaciones en sus chats.

Además, es interesante saber que en Telegram los emojis funcionan como atajos para los stickers. Gracias a la inteligencia artificial de la app de mensajería, cuando escribes un emoji en un chat, ofrecerán automáticamente stickers que coinciden para poder enviarlos. Finalmente, se pueden compartir los packs de stickers simplemente enviando uno de ellos a alguien, que podrá añadirlo tocando sobre él.

Continuar Leyendo